CN105184260B - 一种图像特征提取方法及行人检测方法及装置 - Google Patents

一种图像特征提取方法及行人检测方法及装置 Download PDF

Info

Publication number
CN105184260B
CN105184260B CN201510573728.8A CN201510573728A CN105184260B CN 105184260 B CN105184260 B CN 105184260B CN 201510573728 A CN201510573728 A CN 201510573728A CN 105184260 B CN105184260 B CN 105184260B
Authority
CN
China
Prior art keywords
semantic feature
bound term
implicit semantic
taste
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510573728.8A
Other languages
English (en)
Other versions
CN105184260A (zh
Inventor
朱超
彭宇新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd filed Critical Peking University
Priority to CN201510573728.8A priority Critical patent/CN105184260B/zh
Publication of CN105184260A publication Critical patent/CN105184260A/zh
Application granted granted Critical
Publication of CN105184260B publication Critical patent/CN105184260B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion

Abstract

本发明提供一种图像特征提取方法及行人检测方法,其中,图像特征提取方法包括:首先,获取目标图像中的图像中层特征,然后获取隐含语义特征的初始值,并根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏性约束项和鉴别力约束项;最后根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。该方案考虑到更高层次的语义信息和更强有力的鉴别力信息也是决定特征性能的关键因素,通过同时优化所提出的隐含语义特征学习问题和最大鉴别力约束获得了一种包含信息更加丰富、鉴别力更强的特征,从而能取得更高的行人检测的准确率。

Description

一种图像特征提取方法及行人检测方法及装置
技术领域
本发明涉及图像处理领域,具体涉及一种图像特征提取方法及行人检测方法。
背景技术
图像信息的应用日益广泛,图像特征的提取成为关键技术之一。图像特征表达的是否合适,对图像检测、识别的结果具有重要的影响。例如,对行人进行准确可靠的检测是许多基于行人的计算机视觉和模式识别应用中的重要环节,例如视频监控、辅助驾驶、自动机器人导航等等。得益于强有力的特征表示、鲁棒的行人建模方法和有效的检测策略,当前的行人检测技术不论在精度上还是速度上都取得了显著的进步,其性能在过去数十年来已经提高了约两个数量级,而这些进步很大程度上得益于更好和更有效的特征表示。通过比较不同的检测方法,其背后最重要的原因之一就是所采用的特征表示方法得到了极大的丰富和加强,例如,更有鉴别力的信息、更多的特征种类、更细的尺度划分、增强的归一化方法等等。因此在行人检测方法框架的各个组成部分中,特征扮演着很重要的角色。
但是目前的情况是,一方面由于行人不同的衣着、姿态、遮挡、光照、复杂背景所引起的行人外貌的巨大变化,使得想要取得理想的检测结果仍然具有极大的难度和挑战性;另一方面,现有的主流特征,绝大多数都是人工设计的。以最为流行的HOG特征为例,它是Dalal等人在文献“Histograms of Oriented Gradients for Human Detection”中提出的,它有很多地方都是人为设计的,比如固定的9个梯度方向、4种归一化方式等,都是为了达到更好的精度和速度而人为调校过。因此,尽管HOG特征已成功应用到许多检测方法中,但它只是基于图像中的梯度信息,对图像中更丰富模式的表示能力有限。另外,这些经过人工设计的特征通常只是对特定问题或任务进行了优化,因此很难对新问题或新任务做到普适。
近期,一种新的特征提取方式开始越来越多地被注意和使用,即利用手头现有的训练数据自动学习相应的特征,以使得到的特征具有更好的表示丰富信息的能力,同时去除特征提取过程中人为设计所带来的缺陷,因为低层特征可以进行人工设计,但能够表示更丰富信息的更高层次特征就难以进行人工设计了。Sermanet等人在文献“PedestrianDetection with Unsupervised Multi-Stage Feature Learning”中提出了一种卷积神经网络模型来学习多阶段的特征。Ouyang等人在文献“Joint Deep Learning forPedestrian Detection”中也提出了一种深度学习框架来进行特征学习,并且同时优化特征学习、行人模型和分类方法。Ren等人在文献“Histograms of Sparse Codes for ObjectDetection”中提出了一种新的特征叫做稀疏编码直方图(HSC),此特征基于图像的稀疏表示,通过稀疏编码算法学习得到。通过与经典的HOG特征相比较,作者在目标检测实验中证明了这种特征的有效性。然而,这种特征提取方法也存在以下不足:(1)其特征是直接基于低层图像像素来进行学习的,因而对于图像中丰富模式的表示能力有限;(2)其特征是通过简单的标准稀疏编码算法学习得到的,只能保证最小的重建误差,鉴别能力有限。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中的图像特征基于低层图像像素提取、鉴别能力有限的缺陷,从而提供一种图像特征提取方法及行人检测方法。
本发明提供一种图像特征提取方法,包括如下步骤:
获取目标图像中的图像中层特征;
获取隐含语义特征的初始值;
根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏性约束项和鉴别力约束项;
根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。
优选地,所述根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征的步骤包括:
确定重建误差约束项、稀疏性约束项和鉴别力约束项的求和最小值,公式如下:
min{A+λ1B+λ2J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ1为第一比例因子,λ2为第二比例因子;
获取所述求和最小值对应的隐含语义特征。
优选地,所述根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征的步骤包括:
确定重建误差约束项、稀疏性约束项和鉴别力约束项的乘积最小值,公式如下:
min{A*λ3B*λ4J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ3为第三比例因子,λ4为第四比例因子;
获取所述乘积最小值对应的隐含语义特征。
优选地,所述重建误差约束项为:
其中,y表示所述的图像中层特征,x表示所述的隐含语义特征,i表示第i个,xi表示第i个隐含语义特征,yi表示第i个图像中层特征,N表示特征向量的维数,D表示稀疏编码基础字典,表示根据字典D和隐含语义特征x对中层特征y进行重建后的误差,此项取值越小表明重建误差越小。
优选地,所述稀疏性约束项为:
其中,x表示所述的隐含语义特征,xi表示第i个隐含语义特征,N表示特征向量的维数,表示隐含语义特征的稀疏性,即特征向量中非零元素的个数,此项取值越小表明特征向量的稀疏性越高,即其中非零元素的个数越少。
优选地,所述鉴别力约束项为:
J′=tr(Sw-Sb)
其中,表示不同类别之间的散布矩阵,表示每个类别内部的散布矩阵,Ci表示类别,pi分别为类别Ci的先验概率,分别为类别Ci的样本均值向量,为所有类别中样本的总 均值向量,分别为类别Ci的协方差矩阵,tr(Sw-Sb)表示所 有类别内部的散布程度与不同类别之间的散布程度的差值,此项取值越小表明每个类别内 部的散度越小,而不同类别之间的距离越大,因而分类鉴别力越强。
优选地,根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征的过程,还包括
更新稀疏编码基础字典和隐含语义特征;
通过更新的隐含语义特征和稀疏编码基础字典计算新的重建误差约束项、稀疏性约束项和鉴别力约束项;
反复循环迭代此过程以获得多组重建误差约束项、稀疏性约束项和鉴别力约束项。
此外,本发明还提供一种行人检测的方法,包括如下步骤:
针对每个训练样本提取基础特征;
根据所述基础特征获取所述隐含语义特征;
根据所述隐含语义特征建立行人检测模型;
获取待测样本;
根据所述行人检测模型对所述待测样本进行检测,输出检测结果。
本发明技术方案,具有如下优点:
1.本发明提供的图像特征提取方法,首先,获取目标图像中的图像中层特征,然后获取隐含语义特征的初始值,并根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏性约束项和鉴别力约束项;最后根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。由于重建误差约束项、稀疏性约束项和鉴别力约束项分别从不同方面约束了隐含语义特征的表示能力和鉴别力,使得所述隐含语义特征具有更强的表示能力和分类鉴别力,该方案考虑到更高层次的语义信息和更强有力的鉴别力信息也是决定特征性能的关键因素,通过同时优化所提出的隐含语义特征学习问题和最大鉴别力约束获得了一种包含信息更加丰富、鉴别力更强的特征,从而能取得更高的行人检测的准确率。
2.本发明提供的图像特征提取方法,根据重建误差约束项、稀疏性约束项和鉴别力约束项确定隐含语义特征,采用求和或求积最小的方式来进行优化,从而获得隐含语义特征,使得其综合了重建误差约束项、稀疏性约束项和鉴别力约束项的影响,增强该隐含语义特征的鉴别力。
3.本发明还提供一种行人检测的方法,用于使用所述隐含语义特征进行行人检测,由于隐含语义特征具有更高的鉴别能力,将隐含语义特征学习建模为一种特定的稀疏编码问题,其中字典和稀疏编码系数均基于图像的中层表示(词包模型)优化得到,使得学习出的特征具有更高层次的丰富语义信息,以及应对图像变化的更好鲁棒性;同时,在特征学习阶段直接加入鉴别性信息,通过在上述隐含语义特征学习问题中引入鉴别力约束项,使得学习得到的特征如果来自于同一类别则相互靠近,来自于不同类别则相互疏远,因而具备更强的分类鉴别力,最终能够有效提高行人检测的准确性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中图像特征提取方法的一个具体示例的流程图;
图2为本发明实施例3中行人检测方法的一个具体示例的流程图;
图3是本发明实施例4中的行人目标检测方法的流程图;
图4是实施例5中的图像特征提取装置的结构框图;
图5是实施例6中的行人检测装置的结构框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。其中,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本实施例提供一种图像特征提取方法,如图1所示,包括如下步骤:
S1、获取目标图像中的图像中层特征。
其中,中层特征是指基于视觉关键词和词包模型构建的图像直方图特征,一般通过首先提取底层局部特征(例如SIFT),然后对其进行聚类以获得视觉关键词词典,最后基于这些视觉关键词对原始底层局部特征进行量化以生成词包直方图的方式获取。与常用的图像底层特征也称为基础特征(例如颜色、梯度)相比,中层特征可以表示更丰富的模式和信息,也为获取更高层次的语义信息提供了基础。
S2、获取隐含语义特征的初始值。
本实施例中使用隐含语义特征来对图像特征进行表征,为隐含语义特征定义一个初始值,此处的初始值根据稀疏编码基础字典D和输入的图像中层特征Y来确定,如一般可以初始化字典D为一个随机矩阵,则隐含语义特征的初始值可以设置为DT*Y,或通过标准OMP算法获得。
S3、根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏性约束项和鉴别力约束项。
其中,重建误差约束项为:
其中y表示所述的图像中层特征,x表示所述的隐含语义特征,i表示第i个,xi表示第i个隐含语义特征,yi表示第i个图像中层特征,N表示特征向量的维数,D表示稀疏编码基础字典,表示根据字典D和隐含语义特征x对中层特征y进行重建后的误差,此项取值越小表明重建误差越小。
所述稀疏性约束项为:
其中x表示所述的隐含语义特征,N表示特征向量的维数,表示隐含语义特征的稀疏性,即特征向量中非零元素的个数,此项取值越小表明特征向量的稀疏性越高,即其中非零元素的个数越少。
所述鉴别力约束项为:
J′=tr(Sw-Sb)
其中,表示不同类别之间的散布矩阵,表示每个类别内部的散布矩阵,pi分别为类别Ci的先验概率,分别为类别Ci的样本均值向量,为所有类别中样本的总均值向量,分别为类别Ci的协方差矩阵,tr(Sw-Sb)表示所有类别内部的散布程度与不同类别之间的散布程度的差值,此项取值越小表明每个类别内部的散度越小,而不同类别之间的距离越大,因而分类鉴别力越强。
通过上述公式就可以获得重建误差约束项、稀疏性约束项和鉴别力约束项。
S4、根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。
当根据语义特征初始值、字典D初始值计算出重建误差约束项、稀疏性约束项和鉴别力约束项后,通过标准K-SVD算法对字典D进行更新,获得字典D新的取值,然后基于新的字典D通过标准OMP算法对隐含语义特征进行更新,获得新的隐含语义特征值,再通过新的隐含语义特征和新的字典D计算新的重建误差约束项、稀疏性约束项和鉴别力约束项;反复循环迭代此过程以获得多组重建误差约束项、稀疏性约束项和鉴别力约束项;
在获得多组重建误差约束项、稀疏性约束项和鉴别力约束项后,确定重建误差约束项、稀疏性约束项和鉴别力约束项的求和最小值,公式如下:
min{A+λ1B+λ2J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ1为第一比例因子,λ2为第二比例因子。
然后,获取所述求和最小值对应的隐含语义特征,作为提取到的图像特征。
作为其他可以替换的实施方案,还可以确定重建误差约束项、稀疏性约束项和鉴别力约束项的乘积最小值,公式如下:
min{A*λ3B*λ4J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ3为第三比例因子,λ4为第四比例因子
然后,获取所述乘积最小值对应的隐含语义特征,作为提取到的图像特征。
本方案中,由于重建误差约束项、稀疏性约束项和鉴别力约束项分别从不同方面约束了隐含语义特征的表示能力和鉴别力,使得所述隐含语义特征具有更强的表示能力和分类鉴别力,该方案考虑到更高层次的语义信息和更强有力的鉴别力信息也是决定特征性能的关键因素,通过同时优化所提出的隐含语义特征学习问题和最大鉴别力约束获得了一种包含信息更加丰富、鉴别力更强的特征,从而能取得更高的行人检测的准确率。
实施例2
本实施例提供一种图像特征提取方法的具体的实现方式,包括如下过程。
第一步,对每个样本提取基础特征。
对每个样本首先以固定步长为间隔提取局部特征描述子,然后采用k-means聚类算法将这些特征描述子量化为基于词包模型的固定维数直方图作为样本的基础特征。具体可以描述为:给定一个视觉特征的字典其中M为字典的维数,w为字典中的视觉关键词,则每个样本可以表示为一个基于视觉词包模型的直方图{freq(wi):i=1,2,...,M},其中freq(wi)为视觉关键词wi在每个样本中出现的频率。
第二步,进行隐含语义特征的提取。
隐含语义特征的提取是一种特定的稀疏编码问题,其中字典和稀疏编码系数均基于所述的样本基础特征优化得到,使得学习出的特征具有更高层次的丰富语义信息;另外通过在所述隐含语义特征学习问题中引入鉴别力约束项,使得学习得到的特征如果来自于同一类别则相互靠近,来自于不同类别则相互疏远,因而具备更强的分类鉴别力。
将每个图像中层特征记为一个向量yn={freq(wi)}∈RM,其中n=1,2,...,N,则可以得到原始的特征表示为Y=[y1,y2,...,yN]∈RM×N。给定一个包含K个元素的字典D=[d1,d2,...,dK]∈RM×K,其中每个元素代表着一个更高层次的特征表示,则每个中层特征yi可以通过稀疏编码算法转换为一个K维的编码,且是一个大部分元素为零的稀疏编码。上述对应优化问题可以具体定义为:
其中X=[x1,x2,...,xN]∈RK×N为Y的一组稀疏编码,||xi||1≤L为稀疏约束项,L为预先设定好的稀疏程度。若将稀疏约束项引入到目标函数中,则其可以重新定义为:
其中第一项为重建误差约束,第二项为稀疏约束。λ>0为一个标量优化参数,用以平衡重建误差与稀疏程度。
为了进一步增强所学特征的分类鉴别力,希望来自于相同类别的样本表示为特征后能够保持相互靠近,而来自于不同类别的样本则相互疏远。因此,在特征学习过程中,不同类别之间的距离应该尽量最大化。为了达到这个目的,本发明中采用如下的最大间隔准则作为鉴别力约束项:
其中pi和pj分别为类别Ci和Cj的先验概率,d(Ci,Cj)为两个类别Ci和Cj之间的距离(间隔),具体定义如下:
d(Ci,Cj)=d(mi,mj)-tr(Si)-tr(Sj)
其中mi和mj分别为类别Ci和Cj的样本均值向量: 而Si和Sj分别为类别Ci和Cj的协方差矩阵: Sj=x∈Cj(x-mj)(x-mj)T;而tr(Si)和tr(Sj)分别是矩阵Si和Sj的迹,描述了每个类别中样本的散布程度。这里采用欧氏距离作为d(mi,mj)的衡量标准,则最大间隔准则可以简化为如下形式:
J=tr(Sb-Sw)
其中Sb和Sw分别表示不同类别之间的散布矩阵和每个类别内部的散布矩阵,具体 为:而其中为 所有类别中样本的总均值向量。
最后,将最大化函数J的问题转换为一个等同的最小化函数J′的问题:
J′=tr(Sw-Sb)
然后将这个鉴别力约束项加入上述的目标函数,就可以得到一个新的基于鉴别力增强的隐含语义特征学习问题:
其中∧={λ1,λ2}是一组优化参数,用以平衡重建误差稀疏程度与鉴别力约束J′。通过求解此优化问题,就可以得到基于鉴别力增强的隐含语义特征表示。
由于目标函数对于D和X同时来 说并不是一个凸函数,本方案中采用一种有效的算法来交替优化D和X,优化求解算法包含 两个主要步骤:稀疏编码和字典更新。对于稀疏编码步骤,采用了一种迭代贪婪方法来解决 这个问题:第一步是从字典D中挑选出一个原子,使得只利用这个原子作为字典进行稀疏分 解而得到的所有样本的稀疏编码能够保证目标函数F取得最小值。假设用于进行稀疏分解 的字典D中的原子集合为Δ,则稀疏编码可以由标准正交匹配追踪或基追踪方法计算得到:
其中DΔ是只由在集合Δ中的原子所组成的字典子集。类似地,在接下来的步骤中,我们每次从字典D剩余的原子中再挑出一个原子,将其与上一步骤中已有的原子组成新的原子集合,使得利用这个原子集合作为字典进行稀疏分解而得到的稀疏编码能够保证目标函数F取得最小值,如此循环反复不停地更新所选的原子集合,直到达到设定的终止条件。这里终止条件可以是预先设定好的用于进行稀疏分解的原子数目,也可以当目标函数F的取值不再减小时即终止。对于字典更新步骤,采用标准K-SVD算法中的字典更新方法来进行计算,这样,通过交替迭代稀疏编码和字典更新步骤,就可以有效求解此优化问题,最终得到基于鉴别力增强的隐含语义特征表示。
与现有方法相比,该方案考虑到更高层次的语义信息和更强有力的鉴别力信息也是决定特征性能的关键因素,通过同时优化所提出的隐含语义特征学习问题和最大鉴别力约束获得了一种包含信息更加丰富、鉴别力更强的特征,从而能取得更高的行人检测准确率。
本方案之所以具有上述效果,其原因在于:将隐含语义特征学习建模为一种特定的稀疏编码问题,其中字典和稀疏编码系数均基于图像的中层表示(词包模型)优化得到,使得学习出的特征具有更高层次的丰富语义信息,以及应对图像变化的更好鲁棒性;同时,在特征学习阶段直接加入鉴别性信息,通过在上述隐含语义特征学习问题中引入鉴别力约束项,使得学习得到的特征如果来自于同一类别则相互靠近,来自于不同类别则相互疏远,因而具备更强的分类鉴别力,最终能够有效提高行人检测的准确性
实施例3
本实施例提供一种行人检测的方法,将实施例1中的图像特征提取方法应用于行人检测中,如图2所示,包括如下步骤:
S11、针对每个训练样本提取基础特征。与实施例2中相同,不再赘述。
S12、获取所述基础特征的所述隐含语义特征,提取方式与实施例1和2相同,此处不再赘述。
S13、根据所述隐含语义特征建立行人检测模型。
得到所述的训练样本的隐含语义特征X后,本方案中按照类似于HOG特征的方式将这些隐含语义特征在规则图像单元中统计成直方图的形式,具体地,对于X中每个不为零的xi,采用双线性插值方法将其绝对值|xi|分配给四个与其空间相邻的单元之一。这样在每个图像单元中,通过对局部邻域内的值进行平均,就可以得到一个稠密特征向量FV,最后再对FV进行L2归一化,以减少特征对于图像对比度的依赖,并增强其鲁棒性。基于这些特征,本发明中采用一定深度的决策树作为弱分类器,并将若干个弱分类器通过级联的方式合并为一个强分类器,用以判断样本是否为行人。
采用Adaboost算法实现对弱分类器的迭代优化,和级联合并增强。具体地,Adaboost算法执行T轮选择,每一轮中选择一个分类误差最小的弱分类器,并计算相应的权重。最终,Adaboost算法可以通过线性加权融合T个选择出来的弱分类器得到一个最终的强分类器。在此方式下,只有当样本依次通过了所有弱分类器的检验,才会被判别为行人正例,而只要未通过其中任何一个分类器的检验,则会被判别为负例。
S14、获取待测样本。对于输入的待检测图像,利用滑动窗检测策略将其分为许多重叠的窗口作为候选行人区域。
S15、根据所述行人检测模型对所述待测样本进行检测,输出检测结果。
对于每个候选行人区域使用所述的分类器判断其是否包含行人,最后使用非极大值抑制方法去除重复的窗口以得到最终的检测结果。
本实施例中行人检测方法,在特征学习阶段直接加入鉴别性信息,通过在上述隐含语义特征学习问题中引入鉴别力约束项,使得学习得到的特征如果来自于同一类别则相互靠近,来自于不同类别则相互疏远,因而具备更强的分类鉴别力,最终能够有效提高行人检测的准确性。
实施例4:
本实施例中提供一种行人隐含语义特征的提取方法及基于该方法的行人检测方法,其流程如图3所示,具体包含以下步骤:
(1)将行人检测数据库分为训练集和测试集,并分别对每个样本提取基础特征。其中,训练集用于建立分类器,分类器通过隐含语义特征来训练,测试集用于对分类器的分类效果进行验证。
本实施例中,对每个样本首先以固定步长(例如3个像素)为间隔提取稠密SIFT特征描述子,然后采用k-means聚类算法将这些特征描述子量化为基于词包模型的固定维数(例如512维)直方图作为样本的基础特征。具体可以描述为:给定一个视觉特征的字典其中M为字典的维数,w为字典中的视觉关键词,则每个样本可以表示为一个基于视觉词包模型的直方图{freq(wi):i=1,2,...,M},其中freq(wi)为视觉关键词wi在每个样本中出现的频率。
(2)基于所述的基础特征进行隐含语义特征学习。
步骤(1)中对每个样本提取的基础特征直方图,可以看作是样本的一种中层表示,我们的目标是通过发掘中层特征之间的隐含关系,从视觉字典V中进一步学习得到一组含有更高层次信息的隐含语义其中K<M,表示学习得到的更高层次的图像特征更加紧凑。具体地,此隐含语义特征学习问题可以建模为如下一个特殊的稀疏编码问题。
将每个图像中层特征记为一个向量yn={freq(wi)}∈RM,其中n=1,2,...,N,则可以得到原始的特征表示为Y=[y1,y2,...,yN]∈RM×N。给定一个包含K个元素的字典D=[d1,d2,...,dK]∈RM×K,其中每个元素代表着一个更高层次的特征表示,则每个中层特征yi可以通过稀疏编码算法转换为一个K维的编码,且是一个大部分元素为零的稀疏编码。上述对应优化问题可以具体定义为:
其中X=[x1,x2,...,xN]∈RK×N为Y的一组稀疏编码,||xi||1≤L为稀疏约束项,L为预先设定好的稀疏程度。若将稀疏约束项引入到目标函数中,则其可以重新定义为:
其中第一项为重建误差约束,第二项为稀疏约束。λ>0为一个标量优化参数,用以平衡重建误差与稀疏程度。
为了进一步增强所学特征的分类鉴别力,我们希望来自于相同类别的样本表示为特征后能够保持相互靠近,而来自于不同类别的样本则相互疏远。因此,在特征学习过程中,不同类别之间的距离应该尽量最大化。为了达到这个目的,本实施例中采用如下的最大间隔准则作为鉴别力约束项:
其中pi和pj分别为类别Ci和Cj的先验概率,d(Ci,Cj)为两个类别Ci和Cj之间的距离(间隔),具体定义如下:
d(Ci,Cj)=d(mi,mj)tr(Si)-tr(Sj)
其中mi和mj分别为类别Ci和Cj的样本均值向量:而Si和Sj分别为类别Ci和Cj的协方差矩阵:而tr(Si)和tr(Sj)分别是 矩阵Si和Sj的迹,描述了每个类别中样本的散布程度。这里采用欧氏距离作为d(mi,mj)的衡 量标准,则最大间隔准则可以简化为如下形式:
J=tr(Sb-Sw)
其中Sb和Sw分别表示不同类别之间的散布矩阵和每个类别内部的散布矩阵,具体 为:而其中为所 有类别中样本的总均值向量。
最后,将最大化函数J的问题转换为一个等同的最小化函数J′的问题:
J′=tr(Sw-Sb)
然后将这个鉴别力约束项加入上述的目标函数,就可以得到一个新的基于鉴别力增强的隐含语义特征学习问题:
其中∧={λ1,λ2}是一组优化参数,用以平衡重建误差稀疏程度与鉴别力约束J′。通过求解此优化问题,就可以得到基于鉴别力增强的隐含语义特征表示。
由于目标函数对于D和X同时来 说并不是一个凸函数,本实施例中采用一种有效的算法来交替优化D和X,优化求解算法包 含两个主要步骤:稀疏编码和字典更新。对于稀疏编码步骤,采用了一种迭代贪婪方法来解 决这个问题:第一步是从字典D中挑选出一个原子,使得只利用这个原子作为字典进行稀疏 分解而得到的所有样本的稀疏编码能够保证目标函数F取得最小值。假设用于进行稀疏分 解的字典D中的原子集合为Δ,则稀疏编码可以由标准正交匹配追踪或基追踪方法计算得 到:
其中DΔ是只由在集合Δ中的原子所组成的字典子集。类似地,在接下来的步骤中,我们每次从字典D剩余的原子中再挑出一个原子,将其与上一步骤中已有的原子组成新的原子集合,使得利用这个原子集合作为字典进行稀疏分解而得到的稀疏编码能够保证目标函数F取得最小值,如此循环反复不停地更新所选的原子集合,直到达到设定的终止条件。这里终止条件可以是预先设定好的用于进行稀疏分解的原子数目,也可以当目标函数F的取值不再减小时即终止。对于字典更新步骤,采用标准K-SVD算法中的字典更新方法来进行计算,这样,通过交替迭代稀疏编码和字典更新步骤,就可以有效求解此优化问题,最终得到基于鉴别力增强的隐含语义特征表示。
(3)在训练阶段,利用训练集中训练样本的隐含语义特征学习一个行人检测器。
在得到所述的训练样本的隐含语义特征X后,本方案中按照类似于HOG特征的方式将这些隐含语义特征在规则图像单元中统计成直方图的形式,具体地,对于X中每个不为零的xi,采用双线性插值方法将其绝对值|xi|分配给四个与其空间相邻的单元之一。这样在每个图像单元中,通过对局部邻域内的值进行平均,就可以得到一个稠密特征向量FV,最后再对FV进行L2归一化,以减少特征对于图像对比度的依赖,并增强其鲁棒性。基于这些特征,本发明中采用一定深度的决策树作为弱分类器,并将若干个弱分类器通过级联的方式合并为一个强分类器,用以判断样本是否为行人。
本方案中采用Adaboost算法实现对弱分类器的迭代优化,和级联合并增强。具体地,Adaboost算法执行T轮选择,每一轮中选择一个分类误差最小的弱分类器,并计算相应的权重。最终,Adaboost算法可以通过线性加权融合T个选择出来的弱分类器得到一个最终的强分类器。在此方式下,只有当样本依次通过了所有弱分类器的检验,才会被判别为行人正例,而只要未通过其中任何一个分类器的检验,则会被判别为负例。
(4)在检测阶段,使用所述的行人检测器对测试集中的待检测图像进行检测,得到最终的检测结果。
对于输入的待检测图像,首先采用图像金字塔缩放方式,将输入图像缩放到若干个不同的尺度,并将这些缩放后的图像重叠在一起组成一个金字塔形式,然后利用滑动窗检测策略按照一定的步长对各个图像进行遍历扫描,将其分为许多窗口作为候选行人区域,然后对于每个候选区域使用所述的分类器判断其是否包含行人,保留包含行人的候选窗,最后使用非极大值抑制方法去除重复的候选窗即得到最终的检测结果。
下面的实验结果表明,与现有方法相比,本发明基于隐含语义特征表示的行人检测方法,可以取得更高的检测准确率。
本实施例中采用了Caltech行人检测标准数据集进行实验,该数据集由文献“Pedestrian Detection:An Evaluation of the State of the Art”(作者P.Dollar,C.Wojek,B.Schiele和P.Perona,发表在2012年的IEEE Transactions on PatternAnalysis and Machine Intelligence)提出,其中包括在11个不同时间段采集的城市交通街景,每个时间段内包含有6~13段不等的一分钟时长的视频,其中的行人都做了标注。前6个时间段的数据作为训练集,后5个时间段的数据作为测试集,在实验时每隔30帧取一帧进行测试,测试集包含4024张图像。以下5种文献中的方法被用来作为实验对比:
1、现有方法一:文献“Word Channel based Multi-scale Pedestrian Detectionwithout Image Resizing and Using Only One Classifier”(作者A.D.Costea和S.Nedevschi,发表在2014年的IEEE Conference on Computer Vision and PatternRecognition)中的方法,该方法将视觉关键词这一中层特征表示组织成关键词通道特征的形式用来进行行人检测;
2、现有方法二:文献“Strengthening the Effectiveness of PedestrianDetection with Spatially Pooled Features”(作者S.Paisitkriangkrai,C.Shen和A.van den Hengel,发表在2014年的European Conference on Computer Vision)中的方法,该方法主要利用了协方差描述子和LBP描述子作为特征,并通过空间聚集的方式增强了其鉴别力;
3、现有方法三:文献“Ten Years of Pedestrian Detection,What Have WeLearned?”(作者R.Benenson,M.Omran,J.H.Hosang和B.Schiele,发表在2014年的EuropeanConference on Computer Vision)中的方法,该方法主要利用了基于颜色和梯度信息的积分通道特征,并通过离散余弦变换和运动信息进一步进行了增强;
4、现有方法四:文献“Local Decorrelation for Improved PedestrianDetection”(作者W.Nam,P.Dollar和J.H.Han,发表在2014年的Conference on NeuralInformation Processing Systems)中的方法,该方法也主要利用了基于颜色和梯度信息的积分通道特征,但是将决策树中有效但计算复杂度相对较高的斜分支用局部去相关数据上的正交分支来替代,得到一种过完备但局部去相关的特征表示用于行人检测;
5、现有方法五:文献“Joint Deep Learning for Pedestrian Detection”(作者W.Ouyang和X.Wang,发表在2013年的IEEE International Conference on ComputerVision)中的方法,该方法将特征提取、行人建模和遮挡处理等因素同时考虑,提出了一种联合深度学习框架来最大化每个因素的作用;
6、本发明:本实施例的方法。
实验采用行人检测领域最常用的log-average miss rate指标来评价行人检测的准确性,其反映的是当FPPI(False Positive Per Image)在10-2到100范围之间的平均漏检率,log-average miss rate值越小,表明行人检测的结果就越好。
表1.与现有方法的对比实验结果
表1中是各个比较方法在不同设置测试子集上的结果,其中Reasonable为高度超过49像素全部可见或遮挡低于35%的行人,Overall为高度超过19像素全部可见或遮挡低于80%的行人,None Occlusion为高度超过49像素全部可见的行人,Partial Occlusion为高度超过49像素遮挡低于35%的行人,Large Scale为高度超过99像素全部可见的行人,Near Scale为高度超过79像素全部可见的行人。可以看到本发明在所有测试集上均取得了最好的行人检测结果,这是得益于本发明在特征学习过程中考虑到了更高层次的语义信息和更强有力的鉴别力信息,通过同时优化所提出的隐含语义特征学习问题和最大鉴别力约束获得了一种包含信息更加丰富、鉴别力更强的特征,使得学习得到的特征如果来自于同一类别则相互靠近,来自于不同类别则相互疏远,因而具备更强的分类鉴别力,因此能够提高行人检测的准确率。
实施例5:
本实施例中提供一种图像特征提取装置,结构框图如图4所示,包括
图像中层特征获取单元01,获取目标图像中的图像中层特征;
初始单元02,获取隐含语义特征的初始值;
初始计算单元03,根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏性约束项和鉴别力约束项;
隐含语义特征确定单元04,根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。
隐含语义特征确定单元04中,公式如下:
min{A+λ1B+λ2J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ1为第一比例因子,λ2为第二比例因子;
获取所述求和最小值对应的隐含语义特征。
在其他的实施方案中,隐含语义特征确定单元04中的公式还可以选择如下:
min{A*λ3B*λ4J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ3为第三比例因子,λ4为第四比例因子;
获取所述乘积最小值对应的隐含语义特征。
其中,所述重建误差约束项为:
其中,y表示所述的图像中层特征,x表示所述的隐含语义特征,i表示第i个,xi表示第i个隐含语义特征,yi表示第i个图像中层特征,N表示特征向量的维数,D表示稀疏编码基础字典,表示根据字典D和隐含语义特征x对中层特征y进行重建后的误差,此项取值越小表明重建误差越小。
其中,所述稀疏性约束项为:
其中,x表示所述的隐含语义特征,xi表示第i个隐含语义特征,N表示特征向量的维数,表示隐含语义特征的稀疏性,即特征向量中非零元素的个数,此项取值越小表明特征向量的稀疏性越高,即其中非零元素的个数越少。
其中,所述鉴别力约束项为:
J′=tr(Sw-Sb)
其中,表示不同类别之间的散布矩阵,表示每个类别内部的散布矩阵,Ci表示类别,pi分别为类别Ci的先验概率,分别为类别Ci的样本均值向量,为所有类别中样本的总均值向量,分别为类别Ci的协方差矩阵,tr(Sw-Sb)表示所有类别内部的散布程度与不同类别之间的散布程度的差值,此项取值越小表明每个类别内部的散度越小,而不同类别之间的距离越大,因而分类鉴别力越强。
隐含语义特征确定单元04还包括
更新子单元,更新稀疏编码基础字典和隐含语义特征;
重新计算子单元,通过更新的隐含语义特征和稀疏编码基础字典计算新的重建误差约束项、稀疏性约束项和鉴别力约束项;
迭代子单元,反复循环迭代此过程以获得多组重建误差约束项、稀疏性约束项和鉴别力约束项。
该方案考虑到更高层次的语义信息和更强有力的鉴别力信息也是决定特征性能的关键因素,通过同时优化所提出的隐含语义特征学习问题和最大鉴别力约束获得了一种包含信息更加丰富、鉴别力更强的特征,从而能取得更高的行人检测的准确率。
实施例6:
本实施例中提供一种行人检测装置,结构框图如图5所示,包括
基础特征提取单元001,针对每个训练样本提取基础特征;
隐含语义特征提取单元002,根据所述基础特征获取所述隐含语义特征;
建模单元003,根据所述隐含语义特征建立行人检测模型;
输入单元004,获取待测样本;
检测单元005,根据所述行人检测模型对所述待测样本进行检测,输出检测结果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (7)

1.一种图像特征提取方法,其特征在于,包括如下步骤:
获取目标图像中的图像中层特征;
获取隐含语义特征的初始值;
根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏性约束项和鉴别力约束项;
其中,所述重建误差约束项为:
其中,y表示所述的图像中层特征,x表示所述的隐含语义特征,i表示第i个,xi表示第i个隐含语义特征,yi表示第i个图像中层特征,N表示特征向量的维数,D表示稀疏编码基础字典,表示根据字典D和隐含语义特征x对中层特征y进行重建后的误差,此项取值越小表明重建误差越小;
所述稀疏性约束项为:
其中,x表示所述的隐含语义特征,xi表示第i个隐含语义特征,N表示特征向量的维数,表示隐含语义特征的稀疏性,即特征向量中非零元素的个数,此项取值越小表明特征向量的稀疏性越高,即其中非零元素的个数越少;
所述鉴别力约束项为:
J′=tr(Sw-Sb)
其中,表示不同类别之间的散布矩阵,表示每个类别内部的散布矩阵,Ci表示类别,pi分别为类别Ci的先验概率,分别为类别Ci的样本均值向量,为所有类别中样本的总均值向量,分别为类别Ci的协方差矩阵,tr(Sw-Sb)表示所有类别内部的散布程度与不同类别之间的散布程度的差值,此项取值越小表明每个类别内部的散度越小,而不同类别之间的距离越大,因而分类鉴别力越强;
根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。
2.根据权利要求1所述的方法,其特征在于,所述根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征的步骤包括:
确定重建误差约束项、稀疏性约束项和鉴别力约束项的求和最小值,公式如下:
min{A+λ1B+λ2J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ1为第一比例因子,λ2为第二比例因子;
获取所述求和最小值对应的隐含语义特征。
3.根据权利要求1所述的方法,其特征在于,所述根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征的步骤包括:
确定重建误差约束项、稀疏性约束项和鉴别力约束项的乘积最小值,公式如下:
min{A*λ3B*λ4J′}
其中,A为重建误差约束项,B为稀疏性约束项,J′为鉴别力约束项,λ3为第三比例因子,λ4为第四比例因子;
获取所述乘积最小值对应的隐含语义特征。
4.采用权利要求1-3任一所述的方法进行行人检测的方法,根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征的过程,还包括:
更新稀疏编码基础字典和隐含语义特征;
通过更新的隐含语义特征和稀疏编码基础字典计算新的重建误差约束项、稀疏性约束项和鉴别力约束项;
反复循环迭代此过程以获得多组重建误差约束项、稀疏性约束项和鉴别力约束项。
5.采用权利要求1-3任一所述的方法进行行人检测的方法,包括如下步骤:
针对每个训练样本提取基础特征;
根据所述基础特征获取所述隐含语义特征;
根据所述隐含语义特征建立行人检测模型;
获取待测样本;
根据所述行人检测模型对所述待测样本进行检测,输出检测结果。
6.一种图像特征提取装置,其特征在于,包括
图像中层特征获取单元,获取目标图像中的图像中层特征;
初始单元,获取隐含语义特征的初始值;
初始计算单元,根据所述图像中层特征和隐含语义特征的初始值分别确定重建误差约束项、稀疏性约束项和鉴别力约束项;
其中,所述重建误差约束项为:
其中,y表示所述的图像中层特征,x表示所述的隐含语义特征,i表示第i个,xi表示第i个隐含语义特征,yi表示第i个图像中层特征,N表示特征向量的维数,D表示稀疏编码基础字典,表示根据字典D和隐含语义特征x对中层特征y进行重建后的误差,此项取值越小表明重建误差越小;
所述稀疏性约束项为:
其中,x表示所述的隐含语义特征,xi表示第i个隐含语义特征,N表示特征向量的维数,表示隐含语义特征的稀疏性,即特征向量中非零元素的个数,此项取值越小表明特征向量的稀疏性越高,即其中非零元素的个数越少;
所述鉴别力约束项为:
J′=tr(Sw-Sb)
其中,表示不同类别之间的散布矩阵,表示每个类别内部的散布矩阵,Ci表示类别,pi分别为类别Ci的先验概率,分别为类别Ci的样本均值向量,为所有类别中样本的总均值向量,分别为类别Ci的协方差矩阵,tr(Sw-Sb)表示所有类别内部的散布程度与不同类别之间的散布程度的差值,此项取值越小表明每个类别内部的散度越小,而不同类别之间的距离越大,因而分类鉴别力越强;
隐含语义特征确定单元,根据重建误差约束项、稀疏性约束项和鉴别力约束项,确定隐含语义特征。
7.一种行人检测装置,其特征在于,包括
基础特征提取单元,针对每个训练样本提取基础特征;
隐含语义特征提取单元,使用权利要求6所述的图像特征提取装置根据所述基础特征获取所述隐含语义特征;
建模单元,根据所述隐含语义特征建立行人检测模型;
输入单元,获取待测样本;
检测单元,根据所述行人检测模型对所述待测样本进行检测,输出检测结果。
CN201510573728.8A 2015-09-10 2015-09-10 一种图像特征提取方法及行人检测方法及装置 Expired - Fee Related CN105184260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510573728.8A CN105184260B (zh) 2015-09-10 2015-09-10 一种图像特征提取方法及行人检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510573728.8A CN105184260B (zh) 2015-09-10 2015-09-10 一种图像特征提取方法及行人检测方法及装置

Publications (2)

Publication Number Publication Date
CN105184260A CN105184260A (zh) 2015-12-23
CN105184260B true CN105184260B (zh) 2019-03-08

Family

ID=54906329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510573728.8A Expired - Fee Related CN105184260B (zh) 2015-09-10 2015-09-10 一种图像特征提取方法及行人检测方法及装置

Country Status (1)

Country Link
CN (1) CN105184260B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296667A (zh) * 2016-08-01 2017-01-04 乐视控股(北京)有限公司 手形检测方法和系统
EP3500978A4 (en) * 2016-08-16 2020-01-22 Nokia Technologies Oy METHOD AND DEVICE FOR ZERO SHOT LEARNING
CN106815563B (zh) * 2016-12-27 2020-06-02 浙江大学 一种基于人体表观结构的人群数量预测方法
CN106803080B (zh) * 2017-01-24 2019-12-31 北京理工大学 一种基于形状玻尔兹曼机的补全式行人检测方法
CN108805070A (zh) * 2018-06-05 2018-11-13 合肥湛达智能科技有限公司 一种基于嵌入式终端的深度学习行人检测方法
CN109612463B (zh) * 2018-10-31 2020-07-07 南京航空航天大学 一种基于侧向速度约束优化的行人导航定位方法
CN109543724B (zh) * 2018-11-06 2021-09-03 南京晓庄学院 一种多层鉴别卷积稀疏编码学习方法
CN109753935A (zh) * 2019-01-09 2019-05-14 中南大学 一种基于生成对抗图像补全网络的步态识别方法
CN110263687A (zh) * 2019-06-06 2019-09-20 深圳职业技术学院 一种基于稀疏表示的多视角行人目标检测方法
CN111190952B (zh) * 2019-12-23 2023-10-03 中电海康集团有限公司 一种基于图像金字塔提取城市画像多尺度特征并持久化的方法
TWI764489B (zh) * 2020-12-30 2022-05-11 鴻海精密工業股份有限公司 人行通道環境評估方法、裝置及電子設備

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880873A (zh) * 2012-08-31 2013-01-16 公安部第三研究所 基于图像分割和语义提取实现人员行为识别的系统及方法
CN102968635A (zh) * 2012-11-23 2013-03-13 清华大学 一种基于稀疏编码的图像视觉特征提取方法
CN103377376A (zh) * 2012-04-13 2013-10-30 阿里巴巴集团控股有限公司 图像分类的方法和系统、图像检索的方法和系统
CN103824052A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于多层次语义特征的人脸特征提取方法及识别方法
CN104616277A (zh) * 2013-11-01 2015-05-13 深圳中兴力维技术有限公司 视频结构化描述中的行人定位方法及其装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8928476B2 (en) * 2012-05-17 2015-01-06 Honeywell International Inc. System for advanced security management
US9330296B2 (en) * 2013-03-15 2016-05-03 Sri International Recognizing entity interactions in visual media

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103377376A (zh) * 2012-04-13 2013-10-30 阿里巴巴集团控股有限公司 图像分类的方法和系统、图像检索的方法和系统
CN102880873A (zh) * 2012-08-31 2013-01-16 公安部第三研究所 基于图像分割和语义提取实现人员行为识别的系统及方法
CN102968635A (zh) * 2012-11-23 2013-03-13 清华大学 一种基于稀疏编码的图像视觉特征提取方法
CN104616277A (zh) * 2013-11-01 2015-05-13 深圳中兴力维技术有限公司 视频结构化描述中的行人定位方法及其装置
CN103824052A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于多层次语义特征的人脸特征提取方法及识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于多特征和机器学习的分级行人检测方法;种衍文 等;《自动化学报》;20120315;第38卷(第3期);375-381
行人检测技术综述;苏松志 等;《电子学报》;20120415;第40卷(第4期);814-820

Also Published As

Publication number Publication date
CN105184260A (zh) 2015-12-23

Similar Documents

Publication Publication Date Title
CN105184260B (zh) 一种图像特征提取方法及行人检测方法及装置
Ohn-Bar et al. To boost or not to boost? on the limits of boosted trees for object detection
Van de Sande et al. Fisher and vlad with flair
CN108875818A (zh) 基于变分自编码机与对抗网络结合的零样本图像分类方法
Ming et al. Simple triplet loss based on intra/inter-class metric learning for face verification
CN109255289B (zh) 一种基于统一式生成模型的跨衰老人脸识别方法
CN106203377B (zh) 一种煤粉尘图像识别方法
CN109117897A (zh) 基于卷积神经网络的图像处理方法、装置及可读存储介质
CN110674685B (zh) 一种基于边缘信息增强的人体解析分割模型及方法
CN108509843A (zh) 一种基于加权的Huber约束稀疏编码的人脸识别方法
CN106991355A (zh) 基于拓扑保持的解析型字典学习模型的人脸识别方法
CN109902576B (zh) 一种头肩图像分类器的训练方法及应用
CN106022241A (zh) 一种基于小波变换及稀疏表示的人脸识别方法
CN105608443B (zh) 一种多特征描述及局部决策加权的人脸识别方法
CN114332544A (zh) 一种基于图像块评分的细粒度图像分类方法和装置
Jin et al. Cvt-assd: convolutional vision-transformer based attentive single shot multibox detector
CN112270286A (zh) 一种抗阴影干扰的单色视频目标跟踪方法
WO2022152009A1 (zh) 目标检测方法、装置、设备以及存储介质
Kansizoglou et al. Haseparator: Hyperplane-assisted softmax
Zong et al. Transductive transfer lda with riesz-based volume lbp for emotion recognition in the wild
CN112613474B (zh) 一种行人重识别的方法和装置
CN105760872A (zh) 一种基于鲁棒图像特征提取的识别方法及系统
Dong et al. Scene-oriented hierarchical classification of blurry and noisy images
Mekonnen et al. People detection with heterogeneous features and explicit optimization on computation time
CN114627424A (zh) 一种基于视角转化的步态识别方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220622

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee after: Peking University

Patentee after: New founder holdings development Co.,Ltd.

Address before: 100191 No. 38, Haidian District, Beijing, Xueyuan Road

Patentee before: Peking University

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230410

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee after: Peking University

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee before: Peking University

Patentee before: New founder holdings development Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190308