CN112926689A - 目标的定位方法、装置、电子设备及存储介质 - Google Patents

目标的定位方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112926689A
CN112926689A CN202110349147.1A CN202110349147A CN112926689A CN 112926689 A CN112926689 A CN 112926689A CN 202110349147 A CN202110349147 A CN 202110349147A CN 112926689 A CN112926689 A CN 112926689A
Authority
CN
China
Prior art keywords
sample
picture data
target
picture
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110349147.1A
Other languages
English (en)
Other versions
CN112926689B (zh
Inventor
李卓茜
罗琴
李润静
唐光远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN202110349147.1A priority Critical patent/CN112926689B/zh
Publication of CN112926689A publication Critical patent/CN112926689A/zh
Application granted granted Critical
Publication of CN112926689B publication Critical patent/CN112926689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供的一种目标的定位方法、装置、电子设备及存储介质,包括:获取图片数据;确定所述图片数据中滑动检测窗口对应的各个图片区域的第一特征信息;将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集;基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,以基于所述目标图片区域集实现对目标的定位,其中,所述RF分类器基于所述样本集确定的。

Description

目标的定位方法、装置、电子设备及存储介质
技术领域
本申请涉及图片处理领域,特别地涉及一种目标的定位方法、装置、电子设备及存储介质。
背景技术
方向梯度直方图(HOG,Histogram of Oriented Gradient)特征是一种在计算机视觉和图片处理中用来进行物体检测的特征描述子。它通过计算和统计图片局部区域的梯度方向直方图来构成特征。支持向量机(SVM,Support Vector Mchine)则是一种在分类与回归分析中分析数据的监督式学习模型,其能够支持线性及非线性二分类问题。HOG特征结合SVM分类器已经被广泛应用于目标检测与识别中,例如,对条形码进行检测和识别,但是通过HOG特征结合SVM分类器进行条形码识别时,识别的准确率不高,存在误判情况,例如,将非条形码区域判定为条形码区域,导致条形码的定位的准确率不高。
发明内容
针对上述问题,本申请提供一种目标的定位方法、装置、检测设备及存储介质。
本申请提供了一种目标的定位方法,包括:
获取图片数据;
确定所述图片数据中滑动检测窗口对应的各个图片区域的第一特征信息;
将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集,其中,所述初始图片区域集中每个初始图片区域中包括目标区域,所述SVM分类器基于样本集确定的,所述样本集包括带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;
基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,以基于所述目标图片区域集实现对目标的定位,其中,所述RF分类器基于所述样本集确定的。
在一些实施例中,所述方法还包括:
获取样本集,其中,所述样本集包带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;
基于各个样本图片数据对应的第二特征信息、及对应的标签对初始SVM进行训练,得到所述目标SVM。
在一些实施例中,所述方法还包括:
对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息;
基于各个样本图片数据对应的第三特征信息、及对应的标签对初始RF分类器进行训练,得到目标RF分类器。
在一些实施例中,所述基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,包括:
确定所述初始图片区域集中各个初始图片区域对应的第四特征信息;
对各个初始图片区域对应的第四特征信息进行特征降维处理,得到各个初始图片区域对应的第五特征信息;
将各个初始图片区域对应的第五特征信息输入至RF分类器中,以从各个初始图片区域中确定目标图片区域集。
在一些实施例中,所述确定所述样本集中各个样本图片数据对应的第二特征信息,包括:
确定所述样本集中各个样本图片数据对应的像素特征;
确定所述样本集中各个样本图片数据对应的颜色直方图特征;
确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征;
基于各个像素特征、各个颜色直方图特征和各个HOG特征特征,确定各个样本图片数据对应的第二特征信息。
在一些实施例中,所述确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征,包括:
对样本集中各个样本图片数据进行灰度处理,得到各个灰度样本图片数据;
对各个灰度样本图片数据进行标准化处理,得到各个标准样本图片数据;
计算各个标准样本图片数据对应的HOG特征。
在一些实施例中,对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息,包括:
对各个样本图片数据对应的第二特征信息采用数据中心化方法处理得到各个样本图片数据对应的第六特征信息;
基于各个样本图片数据对应的第六特征信息确定各个样本图片数据中特征与特征之间的协方差矩阵;
求解各个样本图片数据对应的协方差矩阵的特征值和所述特征值对应特征向量;
基于各个样本图片数据对应的特征向量和特征值,确定各个样本图片数据对应的排列矩阵;
获取各个样本图片数据对应的排列矩阵中的前K列数据,得到各个样本图片数据对应的中间矩阵;
基于各个样本图片数据对应的中间矩阵和对应的第二特征信息得到各个图片数据对应的第三特征信息。
本申请实施例提供一种目标的定位装置,包括:
第一获取模块,用于获取图片数据;
第一确定模块,用于确定所述图片数据中滑动检测窗口对应的各个图片区域的第一特征信息;
第二确定模块,用于将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集,其中,所述初始图片区域集中每个初始图片区域中包括目标区域,所述SVM分类器基于样本集确定的,所述样本集包括正样本图片数据和负样本图片数据,所述正样本图片数据中包括目标区域,所述负样本图片数据中不包括目标区域;
第三确定模块,用于基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,以基于所述目标图片区域集完成对目标的定位,其中,所述RF分类器基于所述样本集确定的。
本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行上述任意一项所述目标的定位方法。
本申请实施例提供一种存储介质,该存储介质存储的计算机程序,可被一个或多个处理器执行,可用来实现上述任一项所述目标的定位方法。
本申请提供的一种目标的定位方法、装置、电子设备及存储介质,在图片检测的时候,确定滑动检测窗口对应的各个图片区域的第一特征信息,基于第一特征信息输入至SVM分类器中,确定初始图片区域集,然后通过RF分类器来确定初始图片区域集中的目标图片区域集,从而基于目标图片区域集实现对目标的定位,能够提升目标(如二维码)的识别准确率,从而使得目标的定位更准确。
附图说明
在下文中将基于实施例并参考附图来对本申请进行更详细的描述。
图1为本申请实施例提供的一种目标的定位方法的实现流程示意图;
图2为本申请实施例提供的一种确定第二特征信息的实现流程示意图;
图3为本申请实施例提供的一种确定HOG特征的流程示意图;
图4为本申请实施例体用的一种降维处理得到第三特征信息的实现流程示意图;
图5为本申请实施例提供的一种目标的定位方法的实现流程示意图;
图6为本申请实施例提供的一种目标的定位方法装置的结构示意图;
图7为本申请实施例提供的电子设备的组成结构示意图。
在附图中,相同的部件使用相同的附图标记,附图并未按照实际的比例绘制。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
如果申请文件中出现“第一\第二\第三”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
基于相关技术中存在的问题,本申请实施例提供一种目标的定位方法,所述方法应用于电子设备,所述电子设备可以是计算机、移动终端等,本申请实施例提供的目标的定位方法所实现的功能可以通过检测设备的处理器调用程序代码来实现,其中,程序代码可以保存在计算机存储介质中。
本申请实施例提供一种目标的定位方法,图1为本申请实施例提供的一种目标的定位方法的实现流程示意图,如图1所示,包括:
步骤S101,获取图片数据。
本申请实施例中,图片数据可以是电子设备显示界面中显示的图片数据,可以通过点击图片获取到该图片数据,在一些实施例中,可以通过电子设备的采集模块来采集图片数据,从而获取到图片数据。所述图片数据中可以包括目标,所述目标可以是条形码。本申请实施例中,所述图片数据尺寸大小可以是1024*1024像素。
步骤S102,确定所述图片数据中滑动检测窗口对应的各个图片区域的第一特征信息。
本申请实施例中,在对图片数据中的目标进行检测时,采用预设大小的滑动检测窗口对图片数据进行检测,滑动检测窗口的大小通常小于图片数据尺寸大小,示例性地,滑动检测窗口大小为60*40像素,窗口重叠大小为(0.5,0.5),在进行检测时,滑动检测窗口从图片数据的左上角开始滑动,基于固定的移动步长,然后依次对滑动检测窗口的覆盖的图片区域进行特征提取,从而提取出各个滑动窗口对应的各个图片区域的第一特征信息。
本申请实施例中,所述第一特征信息是基于各个图片区域的像素特征、各个图片区域的颜色特征,各个图片区域的HOG特征确定的。通过将各个图片区域的像素特征、各个图片区域的颜色特征,各个图片区域的HOG特征进行拼接,得到各个图片区域对应的第一特征信息,本申请实施例中,所述第一特征信息用向量表示。
步骤S103,将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集。
本申请实施例中,所述初始图片区域集中每个初始图片区域中包括目标区域。所述SVM分类器基于样本集确定的,所述样本集包括带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域。本申请实施例中,可以基于样本集对初始SVM分类器进行训练,从而确定目标SVM,该目标SVM分类器可以基于第一特征信息确定各个图片区域的分类,所述图片区域的分类可以包括初始图片区域集、剔除图片区域集,该初始图片区域集中各个初始图片区域包括目标区域,剔除图片区域集中的各个剔除图片区域中不包括目标区域。示例性地,目标为二维码,目标区域为二维码的部分区域,即各个初始图片区域中都包括二维码的部分区域,而剔除图片区域集中的各个剔除图片区域都不包括二维码的区域。
本申请实施例中,当确定初始图片区域集和剔除图片区域集后,将剔除图片区域集剔除,保留初始图片区域集进行后续的处理。由于SVM分类器由于自身性能局限性,例如,SVM分类器具有对缺失数据、参数及核函数的选择比较敏感,对大规模训练样本难以实施等缺点,在条形码目标的定位识别上具有一定的局限性,导致的对于目标区域的分类存在一定误判,将剔除图片区域判定为初始图片区域的问题。因此,本申请实施例中,将确定的初始图片区域集保留下来,进行后续用RF分类器进行处理。
步骤S104,基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,以基于所述目标图片区域集完成对目标的定位。
本申请实施例中,所述RF分类器基于所述样本集确定的。可以通过获取样本集,其中,所述样本集包带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;确定所述样本集中各个样本图片数据对应的第二特征信息,对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息;基于各个样本图片数据对应的第三特征信息对初始RF分类器进行训练,得到目标RF分类器。
本申请实施例中,由于通过降维的第三特征信息来训练RF,可以提升训练速度。本申请实施例中,目标RF分类器是一种通过随机方式建立的包含多个决策树的分类器,其能够对不平衡的数据集起到一定平衡误差的效果,且具有较强的泛化能力及鲁棒性。训练时决策树之间彼此独立,是一种训练速度较快的并行化方法。通过RF分类器进行二次分类,能够你比SVM分类器本身的局限性所导致的分类性能有一定限制的问题。
本申请实施例中,通过RF分类器进行二次分类可以剔除掉通过SVM将剔除图片区域分类为初始图片区域的问题。
本申请实施例中,当确定了目标图片区域集后,可以基于目标区域完成对目标的定位,例如完成对条形码的定位,完成对条形码的定位完成后,可以通过校正技术,例如经过形态学后的仿射变化,在对校正后得到的图片进行识别,从而识别出二维码。
本申请实施例提供的目标的定位方法,在图片检测的时候,确定各个滑动检测窗口对应的各个图片区域的第一特征信息,基于第一特征信息输入至SVM分类器中,确定初始图片区域集,然后通过RF分类器来确定初始图片区域集中的目标图片区域集,从而基于目标图片区域集实现对目标的定位,能够提升目标(如二维码)的识别准确率,从而使得目标的定位更准确。
在步骤S103“将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集”之前,所述方法还包括:
步骤S1,获取样本集。
本申请实施例中,所述样本集包带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域。示例性地,样本集中带有正样本标签的样本图片数据和带有负样本标签的样本图片数据均为3100,各个样本图片数据的尺寸大小为60*40(像素),也就是说,样本图片数据的尺寸大小与滑动检测窗口的大小是相同的。
步骤S2,确定所述样本集中各个样本图片数据对应的第二特征信息。
本申请实施例中,当获取了样本集后,可以对样本集中的各个样本图片数据进行特征提取,以确定各个样本图片数据对应的第二特征信息,本申请实施例中,可以通过提取各个样本图片数据像素特征、颜色值放图特征及HOG特征,然后将各个样本图片数据的像素特征、及对应的颜色值放图特征、对应的HOG特征进行拼接,从而得到各个样本图片数据的第二特征信息。
本申请实施例中,确定所述样本集中各个样本图片数据对应的第二特征信息可以通过以下步骤实现:确定所述样本集中各个样本图片数据对应的像素特征;确定所述样本集中各个样本图片数据对应的颜色直方图特征;确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征;基于各个像素特征、各个颜色直方图特征和各个HOG特征特征,确定各个样本图片数据对应的第二特征信息
步骤S3,基于各个样本图片数据对应的第二特征信息、及对应的标签对初始SVM进行训练,得到所述目标SVM。
本申请实施例中,初始SVM采用是scikit-learn库中封装好的模块,因在采用目标SVM进行分类时,将样本图片数据分为初始图片区域集和剔除图片区域集,因此,初始SVM采用的核函数为线性函数。通过将各个样本图片数据对应的第二特征信息输入及对应的标签送入至初始SVM后,可以得到最终的目标SVM分类器。
SVM分类器是在分类与回归分析中分析数据的监督式学习算法。该算法能够基于结构风险最小化理论在特征空间中构建最优超平面使学习器得到全局最优化、并在整个样本空间的期望以某个概率满足一定上界。对于线性可分的空间,该算法作为一种非概率二元线性分类器能够将空间中点以尽可能宽的明显的间隔分开,这样就使得单独类别的实例被尽可能宽的间隔分开,对于线性不可分的情况,通过使用非线性映射算法将低维的输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能。
本申请实施例提供的目标的定位方法,通过获取样本集来对初始SVM分类器进行训练,得到目标SVM分类器,在图片数据检测的时候,确定各个滑动检测窗口对应的各个图片区域的第一特征信息,基于第一特征信息输入至SVM分类器中,确定初始图片区域集,然后通过RF分类器来确定初始图片区域集中的目标图片区域集,从而基于目标图片区域集实现对目标的定位,能够提升目标(如二维码)的识别准确率,从而使得目标的定位更准确。
在一些实施例中,在步骤S2“确定所述样本集中各个样本图片数据对应的第二特征信息”之后,所述方法还包括:
步骤S4,对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息。
本申请实施例中,可以采用主成分分析算法对第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息。
步骤S5,基于各个样本图片数据对应的第三特征信息、及对应的标签对初始RF分类器进行训练,得到目标RF分类器。
RF分类器是一种比较新的机器学习模型,其由LeoBreiman提出,其实质是对决策树算法的一种改进,将多个决策树合并在一起,每棵树的建立依赖于一个独立抽取的样品,森林中的每棵树具有相同的分布,分类误差取决于每一棵树的分类能力和它们之间的相关性,它通过自助法(bootstrap)重采样技术从原始训练样本集N中有放回的重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成k个分类树组成随机森林,新数据的分类结果按分类树投票多少形成的分数而定。其特征选择采用随机的方法去分裂每一个节点,然后比较不同情况下产生的误差,能够检测到的内在分类误差、分类能力和相关性决定选择特征的数目。单颗树的分类能力可能很小,但在随机产生大量的决策树后,会较大程度提升测试样本的最终分类结果。
本申请实施例提提供的目标的定位方法,通过对第二特征信息进行降维处理,得到第三特征信息,通过第三特征信息来确定训练得到目标RF分类器,可以提升训练速度,在图片检测的时候,基于滑动检测窗口来确定各个滑动检测窗口对应的各个图片区域的第一特征信息,基于第一特征信息输入至SVM分类器中,确定初始图片区域集,然后通过RF分类器来确定初始图片区域集中的目标图片区域集,从而基于目标图片区域集实现对目标的定位,能够提升目标(如二维码)的识别准确率,从而使得目标的定位更准确。
在一些实施例中,步骤S104“基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集”可以通过以下步骤实现:
步骤S1041,确定所述初始图片区域集中各个初始图片区域对应的第四特征信息。
本申请实施例中,各个初始图片区域对应的第三特征可以基于各个初始图片区域对应的像素特征、颜色直方图特征、HOG特征进行拼接得到。
步骤S1042,对各个初始图片区域对应的第四特征信息进行特征降维处理,得到各个初始图片区域对应的第五特征信息。
本申请实施例中,可以采用主成分分析算法对第四特征信息进行特征降维处理,得到各个样本图片数据对应的第五特征信息。
步骤S1043,将各个初始图片区域对应的第五特征信息输入至RF分类器中,以从各个初始图片区域中确定目标图片区域集。
在一些实施例中,步骤S2“确定所述样本集中各个样本图片数据对应的第二特征信息”可以通过以下步骤实现,图2为本申请实施例提供的一种确定第二特征信息的实现流程示意图,如图2所示,包括::
步骤S21,确定所述样本集中各个样本图片数据对应的像素特征。
将各个样本图片数据规整为16*16像素大小的图片后,对图片像素特征进行拉伸平铺,由于各个样本图片数据是三通道的,因而得到256*3=768维的各个样本图片数据的像素特征。
步骤S22,确定所述样本集中各个样本图片数据对应的颜色直方图特征。
本申请实施例中,各个样本图片数据为彩色图片,彩色图片有三个通道,将三个通道分别取出来绘制每个通道上像素的分布,该特征称为颜色特征。颜色特征是一种全局特征,其能够简单描述图片中颜色的局部分布及每种色彩所处的位置。该特征具有不受图片旋转、平移及尺幅变化影响的优点。本申请实施例中的颜色空间选取图片的YUV空间,提取图片的亮度信号Y和色度信号U、V,设置该特征的维度为96维。
步骤S23,确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征。
本申请实施例中,HOG特征是一种在计算机视觉和图片处理中用来进行物体检测的特征描述子,它通过计算和统计图片局部区域的梯度方向直方图来构成特征。该特征能够较好的描述局部目标表象和形状的梯度及边缘方向密度的分布,因而能够较好的表述条形码图片特征。
步骤S24,基于各个像素特征、各个颜色直方图特征和各个HOG特征特征,确定各个样本图片数据对应的第二特征信息。
本申请实施例中,可以将各个像素特征、对应的各个颜色直方图特征、对应的各个HOG特征特征进行拼接得到第二特征信息,该第二特征信息的特征维度为1632。
本申请实施例提供的一种目标的定位方法,通过获取像素特征、颜色直方图特征和HOG特征来确定第二特征信息,通过第二特征信息进行SVM分类器的训练,可以使识别的目标更准确。
在一些实施例中,步骤S23“确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征”可以通过以下步骤实现,图3为本申请实施例提供的一种确定HOG特征的流程示意图,如图3所示,包括:
步骤S231,对样本集中各个样本图片数据进行灰度处理,得到各个灰度样本图片数据。
步骤S232,对各个灰度样本图片数据进行标准化处理,得到各个标准样本图片数据。
本申请实施例中,在灰度样本图片数据的纹理强度中,局部表层曝光的贡献的比重较大,通过采用Gamma校正法对各个灰度样本图片数据进行标准化处理,这种压缩处理能够有效降低灰度样本图片数据局部的阴影和光照变化,从而达到调节灰度样本图片数据对比度,抑制各个灰度样本图片数据中噪声干扰的目标,Gamma压缩公式如下:I(x,y)=I(x,y)gamma,其中gamma=1/2,从而得到各个标准样本图片数据。
步骤S233,计算各个标准样本图片数据对应的HOG特征。
本申请实施例中,由于对各个标准样本图片数据的求导操作能够弱化光照的影响,捕获图片中轮廓、人影和纹理信息,通过求导计算各个标准样本图片数据横、纵坐标方向的梯度,从而获取各个标准样本图片数据中每个像素的梯度的梯度方向值,其中各个标准样本图片数据中像素点(x,y)的梯度为:
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1)
上式中Gx(x,y),Gy(x,y),H(x,y)分别表示输入各个标准样本图片数据中像素点(x,y)处的水平方向梯度、垂直方向梯度和像素值。像素点(x,y)处的梯度幅值和梯度方向分别为:
Figure BDA0003001851040000121
Figure BDA0003001851040000122
在确定各个像素点的梯度幅值和梯度方向后,为每个细胞单元构建梯度方向直方图:将各个标准样本图片数据分出若干个“单元格cell”,每个cell为8*8个像素,采用8个bin的直方图来统计这8*8个像素的梯度信息,即将cell的梯度方向的360度分成16个方向块。
示例性地,如果像素梯度方向为22.5-45度,则直方图第2个bin的计数加一,这样将cell中每个像素的梯度方向在直方图中进行加权投影(映射到固定的角度范围)即可得到cell的梯度直方图,对应cell的8维特征向量。梯度的大小则作为投影的权值,即如果梯度方向为22.5-45度,梯度大小为2,则直方图第二个bin的计数则加二。每相邻两个单元cell构成一个block。
把细胞组合成更大的块,归一化梯度直方图:局部光照及前景背景对比度的变化都较大程度的影响梯度强度的变化范围,因而通过对梯度强度的归一化操作对光照、阴影和边缘进行压缩处理,可以采取如下方式:将细胞单元组合为更大的空间上连通的区域即为一个block。将block中所有cell的特征向量串联起来得到该block的HOG特征,并归一化此块描述符作为HOG描述符。
将检测窗口中所有重叠的图片区域进行HOG特征的收集并将它们组合成最终的HOG特征。
在一些实施例中,步骤S4“对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息”可以通过以下步骤实现,图4为本申请实施例体用的一种降维处理得到第三特征信息的实现流程示意图,如图4所示,包括:
步骤41,对各个样本图片数据对应的第二特征信息采用数据中心化方法处理得到各个样本图片数据对应的第六特征信息。
本申请实施例中,所述第二特征信息可以用矩阵表示,数据中心化即对第二特征信息中中的每一行(即一个特征属性)进行零均值化,即减去这一行的均值。
步骤S42,基于各个样本图片数据对应的第六特征信息确定各个样本图片数据中特征与特征之间的协方差矩阵。
步骤S43,求解各个样本图片数据对应的协方差矩阵的特征值和所述特征值对应特征向量。
步骤S44,基于各个样本图片数据对应的特征向量和特征值,确定各个样本图片数据对应的排列矩阵。
步骤S45,获取各个样本图片数据对应的排列矩阵中的前K列数据,得到各个样本图片数据对应的中间矩阵。
步骤S46,基于各个样本图片数据对应的中间矩阵和对应的第二特征信息得到各个图片数据对应的第三特征信息。
基于前述的各个实施例,本申请实施例提供再提供一种目标定位方法,所述方法包括:训练阶段和测试阶段,训练阶段和测试阶段对于图片数据的准备及预处理、特征提取及对于图片特征进行降维过程是相同的。所以用测试阶段来进行说明,图5为本申请实施例提供的一种目标的定位方法的实现流程示意图,如图5所示,包括:
步骤S501,获取测试集(同上述实施例中的图片数据)。
步骤S502,提取测试集的特征信息(同上述实施例中第一特征信息)。
本申请实施例中,特征信息包括基于像素特征、颜色特征和HOG特征进行拼接得到。
步骤S503,将特征信息输入至SVM分类器(同上述实施例中的目标SVM分类器)。
步骤S504,SVM分类器采用非极大值抑制算法进行背景(同上述实施例中的不包括目标区域)和前景(同上述实施例中的包括目标区域)的判断。
步骤S505,SVM分类器确定条形码初次定位分割结果(同上述实施例中的初始图片区域集)。
步骤S506,将初次定位分割结果输入至RF分类器(同上述实施例中的目标RF分类器)中。
步骤S507,RF分类器输出最终定位结果。
其中训练阶段步骤如下:图片数据准备及处理、提取图片特征、采用算法进行特征降维、训练SVM分类器和RF分类器。
测试阶段步骤如下:图片数据准备及处理、提取图片特征、pca算法进行特征降维、使用SVM分类器对图片进行初步的定位分类,实现前景及背景的划分(此时包含误判的情况,即判定为前景的区域实则为背景)、使用RF分类器对SVM初步判定为前景的区域进行二次的分类判定从而实现目标的二次筛选,更加准确的选区出前景目标。
进行数据准备和图片特征的提取,其中滑动检测窗口大小为60*40像素,窗口重叠大小为(0.5,0.5),按照滑窗大小和滑窗重叠区域大小计算滑窗的步长,图片上滑窗所在位置,提取滑窗中的图片特征,调用训练好的SVM分类器,将检测窗中提取的特征输入该分类器中进行目标为前景和背景的判定,将SVM判定为前景的目标区域保存,调用训练好的RF分类器,对SVM判定为前景的目标区域进行二次筛选判定,筛选掉将背景误判为前景的区域,从而进一步提升目标检测的准确率。
将RF分类器用于对基于HOG-SVM算法定位识别出的条形码进行二次分类,该分类器能够一定程度弥补SVM分类器本身局限性所导致的分类性能的限制,从而实现对于初次检测目标的二次分类,减少对于目标的误判,提升条形码目标定位的准确率。
基于前述的实施例,本申请实施例提供一种目标的定位装置,该装置包括的各模块、以及各模块包括的各单元,可以通过计算机设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(CPU,Central ProcessingUnit)、微处理器(MPU,Microprocessor Unit)、数字信号处理器(DSP,Digital SignalProcessing)或现场可编程门阵列(FPGA,Field Programmable Gate Array)等。
本申请实施例提供一种目标的定位方法装置,图6为本申请实施例提供的一种目标的定位方法装置的结构示意图,如图6所示,目标的定位装置600包括:
第一获取模块601,用于获取图片数据;
第一确定模块602,用于确定所述图片数据中滑动检测窗口对应的各个图片区域的第一特征信息;
第二确定模块603,用于将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集,其中,所述初始图片区域集中每个初始图片区域中包括目标区域,所述SVM分类器基于样本集确定的,所述样本集包括带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;
第三确定模块604,用于基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,以基于所述目标图片区域集完成对目标的定位,其中,所述RF分类器基于所述样本集确定的。
在一些实施例中,目标的定位装置600包括还包括:
第二获取模块,用于获取样本集,其中,所述样本集包带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;
第四确定模块,用于确定所述样本集中各个样本图片数据对应的第二特征信息;
第一训练模块,用于基于各个样本图片数据对应的第二特征信息、及对应的标签对初始SVM进行训练,得到所述目标SVM。
在一些实施例中,目标的定位装置600包括还包括:
降维模块,用于对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息;
第二训练模块,用于基于各个样本图片数据对应的第三特征信息、及对应的标签对初始RF分类器进行训练,得到目标RF分类器。
在一些实施例中,第三确定模块604,包括:
第一确定单元,用于确定所述初始图片区域集中各个初始图片区域对应的第四特征信息;
降维单元,用于对各个初始图片区域对应的第四特征信息进行特征降维处理,得到各个初始图片区域对应的第五特征信息;
第二确定单元,用于将各个初始图片区域对应的第五特征信息输入至RF分类器中,以从各个初始图片区域中确定目标图片区域集。
在一些实施例中,第四确定模块,包括:
第三确定单元,用于确定所述样本集中各个样本图片数据对应的像素特征;
第四确定单元,用于确定所述样本集中各个样本图片数据对应的颜色直方图特征;
第五确定单元,用于确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征;
第六确定单元,用于基于各个像素特征、各个颜色直方图特征和各个HOG特征特征,确定各个样本图片数据对应的第二特征信息。
在一些实施例中,所述第五确定单元,包括:
灰度处理子单元,用于对样本集中各个样本图片数据进行灰度处理,得到各个灰度样本图片数据;
标准化处理子单元,用于对各个灰度样本图片数据进行标准化处理,得到各个标准样本图片数据;
计算子单元,用于计算各个标准样本图片数据对应的HOG特征。
在一些实施例中,降维模块,包括:
数据中心化单元,用于对各个样本图片数据对应的第二特征信息采用数据中心化方法处理得到各个样本图片数据对应的第六特征信息;
第七确定单元,用于基于各个样本图片数据对应的第六特征信息确定各个样本图片数据中特征与特征之间的协方差矩阵;
计算单元,用于求解各个样本图片数据对应的协方差矩阵的特征值和所述特征值对应特征向量;
第八确定单元,用于基于各个样本图片数据对应的特征向量和特征值,确定各个样本图片数据对应的排列矩阵;
获取单元,用于获取各个样本图片数据对应的排列矩阵中的前K列数据,得到各个样本图片数据对应的中间矩阵;
第九确定单元,用于基于各个样本图片数据对应的中间矩阵和对应的第二特征信息得到各个图片数据对应的第三特征信息。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的目标的定位方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
相应地,本申请实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述实施例中提供的目标的定位方法中的步骤。
本申请实施例提供一种电子设备;图7为本申请实施例提供的电子设备的组成结构示意图,如图7所示,所述电子设备700包括:一个处理器701、至少一个通信总线702、用户接口703、至少一个外部通信接口704、存储器705。其中,通信总线702配置为实现这些组件之间的连接通信。其中,用户接口703可以包括显示屏,外部通信接口704可以包括标准的有线接口和无线接口。所述处理器701配置为执行存储器中存储的目标的定位方法的程序,以实现以上述实施例提供的目标的定位方法中的步骤。
以上显示设备和存储介质实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请计算机设备和存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台控制器执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种目标的定位方法,其特征在于,包括:
获取图片数据;
确定所述图片数据中滑动检测窗口对应的各个图片区域的第一特征信息;
将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集,其中,所述初始图片区域集中每个初始图片区域中包括目标区域,所述SVM分类器基于样本集确定的,所述样本集包括带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;
基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,以基于所述目标图片区域集完成对目标的定位,其中,所述RF分类器基于所述样本集确定的。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取样本集,其中,所述样本集包带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;
确定所述样本集中各个样本图片数据对应的第二特征信息;
基于各个样本图片数据对应的第二特征信息、及对应的标签对初始SVM进行训练,得到所述目标SVM。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息;
基于各个样本图片数据对应的第三特征信息、及对应的标签对初始RF分类器进行训练,得到目标RF分类器。
4.根据权利要求3所述的方法,其特征在于,所述基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,包括:
确定所述初始图片区域集中各个初始图片区域对应的第四特征信息;
对各个初始图片区域对应的第四特征信息进行特征降维处理,得到各个初始图片区域对应的第五特征信息;
将各个初始图片区域对应的第五特征信息输入至RF分类器中,以从各个初始图片区域中确定目标图片区域集。
5.根据权利要求2所述的方法,其特征在于,所述确定所述样本集中各个样本图片数据对应的第二特征信息,包括:
确定所述样本集中各个样本图片数据对应的像素特征;
确定所述样本集中各个样本图片数据对应的颜色直方图特征;
确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征;
基于各个像素特征、各个颜色直方图特征和各个HOG特征特征,确定各个样本图片数据对应的第二特征信息。
6.根据权利要求5所述的方法,其特征在于,所述确定所述样本集中各个样本图片数据对应的方向梯度直方图HOG特征,包括:
对样本集中各个样本图片数据进行灰度处理,得到各个灰度样本图片数据;
对各个灰度样本图片数据进行标准化处理,得到各个标准样本图片数据;
计算各个标准样本图片数据对应的HOG特征。
7.根据权利要求3所述的方法,其特征在于,所述对各个样本图片数据对应的第二特征信息进行特征降维处理,得到各个样本图片数据对应的第三特征信息,包括:
对各个样本图片数据对应的第二特征信息采用数据中心化方法处理得到各个样本图片数据对应的第六特征信息;
基于各个样本图片数据对应的第六特征信息确定各个样本图片数据中特征与特征之间的协方差矩阵;
求解各个样本图片数据对应的协方差矩阵的特征值和所述特征值对应特征向量;
基于各个样本图片数据对应的特征向量和特征值,确定各个样本图片数据对应的排列矩阵;
获取各个样本图片数据对应的排列矩阵中的前K列数据,得到各个样本图片数据对应的中间矩阵;
基于各个样本图片数据对应的中间矩阵和对应的第二特征信息得到各个图片数据对应的第三特征信息。
8.一种目标的定位装置,其特征在于,包括:
第一获取模块,用于获取图片数据;
第一确定模块,用于确定所述图片数据中滑动检测窗口对应的各个图片区域的第一特征信息;
第二确定模块,用于将各个第一特征信息输入至目标支持向量机SVM分类器中以从各个图片区域中确定初始图片区域集,其中,所述初始图片区域集中每个初始图片区域中包括目标区域,所述SVM分类器基于样本集确定的,所述样本集包括带有正样本标签的样本图片数据和带有负样本标签的样本图片数据,所述带有正样本标签的样本图片数据中包括目标区域,带有负样本标签的样本图片数据中不包括目标区域;
第三确定模块,用于基于目标随机森林RF分类器从所述初始图片区域集中确定目标图片区域集,以基于所述目标图片区域集完成对目标的定位,其中,所述RF分类器基于所述样本集确定的。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行如权利要求1至7任意一项所述的目标的定位方法。
10.一种存储介质,其特征在于,该存储介质存储的计算机程序,能够被一个或多个处理器执行,能够用来实现如权利要求1至7中任一项所述的目标的定位方法。
CN202110349147.1A 2021-03-31 2021-03-31 目标的定位方法、装置、电子设备及存储介质 Active CN112926689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110349147.1A CN112926689B (zh) 2021-03-31 2021-03-31 目标的定位方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110349147.1A CN112926689B (zh) 2021-03-31 2021-03-31 目标的定位方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112926689A true CN112926689A (zh) 2021-06-08
CN112926689B CN112926689B (zh) 2024-07-12

Family

ID=76176795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110349147.1A Active CN112926689B (zh) 2021-03-31 2021-03-31 目标的定位方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112926689B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150572A (zh) * 2012-12-11 2013-06-12 中国科学院深圳先进技术研究院 在线式视觉跟踪方法
CN103824052A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于多层次语义特征的人脸特征提取方法及识别方法
CN104392223A (zh) * 2014-12-05 2015-03-04 青岛科技大学 二维视频图像中的人体姿态识别方法
CN107206384A (zh) * 2015-02-17 2017-09-26 西门子医疗保健诊断公司 用于实验室自动化的侧视样品管图像中的条形码标签检测
CN107992800A (zh) * 2017-11-10 2018-05-04 杭州晟元数据安全技术股份有限公司 一种基于svm和随机森林的指纹图像质量判断方法
CN108052955A (zh) * 2017-11-03 2018-05-18 中国科学院计算技术研究所 一种高精度盲文识别方法及系统
CN108898623A (zh) * 2018-05-24 2018-11-27 北京飞搜科技有限公司 目标跟踪方法及设备
CN110929806A (zh) * 2019-12-06 2020-03-27 腾讯科技(北京)有限公司 基于人工智能的图片处理方法、装置及电子设备
CN111523413A (zh) * 2020-04-10 2020-08-11 北京百度网讯科技有限公司 生成人脸图像的方法和装置
CN112070727A (zh) * 2020-08-21 2020-12-11 电子科技大学 一种基于机器学习的金属表面缺陷检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150572A (zh) * 2012-12-11 2013-06-12 中国科学院深圳先进技术研究院 在线式视觉跟踪方法
CN103824052A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于多层次语义特征的人脸特征提取方法及识别方法
CN104392223A (zh) * 2014-12-05 2015-03-04 青岛科技大学 二维视频图像中的人体姿态识别方法
CN107206384A (zh) * 2015-02-17 2017-09-26 西门子医疗保健诊断公司 用于实验室自动化的侧视样品管图像中的条形码标签检测
CN108052955A (zh) * 2017-11-03 2018-05-18 中国科学院计算技术研究所 一种高精度盲文识别方法及系统
CN107992800A (zh) * 2017-11-10 2018-05-04 杭州晟元数据安全技术股份有限公司 一种基于svm和随机森林的指纹图像质量判断方法
CN108898623A (zh) * 2018-05-24 2018-11-27 北京飞搜科技有限公司 目标跟踪方法及设备
CN110929806A (zh) * 2019-12-06 2020-03-27 腾讯科技(北京)有限公司 基于人工智能的图片处理方法、装置及电子设备
CN111523413A (zh) * 2020-04-10 2020-08-11 北京百度网讯科技有限公司 生成人脸图像的方法和装置
CN112070727A (zh) * 2020-08-21 2020-12-11 电子科技大学 一种基于机器学习的金属表面缺陷检测方法

Also Published As

Publication number Publication date
CN112926689B (zh) 2024-07-12

Similar Documents

Publication Publication Date Title
US11574187B2 (en) Pedestrian attribute identification and positioning method and convolutional neural network system
US8792722B2 (en) Hand gesture detection
US8750573B2 (en) Hand gesture detection
US8582836B2 (en) Face recognition in digital images by applying a selected set of coefficients from a decorrelated local binary pattern matrix
An et al. Scene learning for cloud detection on remote-sensing images
CN108549886A (zh) 一种人脸活体检测方法及装置
US20150205997A1 (en) Method, apparatus and computer program product for human-face features extraction
US11699290B1 (en) Pedestrian re-identification method and apparatus based on local feature attention
CN111860494A (zh) 图像目标检测的优化方法、装置、电子设备和存储介质
US11816946B2 (en) Image based novelty detection of material samples
CN109190456B (zh) 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法
CN111476271B (zh) 图标识别的方法、装置、系统、计算机设备和存储介质
US10311332B2 (en) Orientation-based subject-matching in images
EP3044733A1 (en) Image processing
CN108647264A (zh) 一种基于支持向量机的图像自动标注方法及装置
CN107610136B (zh) 基于凸包结构中心查询点排序的显著目标检测方法
CN115082400A (zh) 一种图像处理方法、装置、计算机设备及可读存储介质
CN113537158B (zh) 一种图像目标检测方法、装置、设备及存储介质
CN112926689B (zh) 目标的定位方法、装置、电子设备及存储介质
CN115205155A (zh) 一种畸变图像的矫正方法、装置及终端设备
Zhou et al. On contrast combinations for visual saliency detection
JP6717769B2 (ja) 情報処理装置及びプログラム
CN113240611A (zh) 一种基于图片序列的异物检测方法
CN114202665A (zh) 一种图像相似度确定方法及装置、设备、存储介质
CN111310818A (zh) 特征描述子确定方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant