CN111368861A - 在图像物体检测过程中确定子部件顺序的方法和装置 - Google Patents

在图像物体检测过程中确定子部件顺序的方法和装置 Download PDF

Info

Publication number
CN111368861A
CN111368861A CN201811590549.5A CN201811590549A CN111368861A CN 111368861 A CN111368861 A CN 111368861A CN 201811590549 A CN201811590549 A CN 201811590549A CN 111368861 A CN111368861 A CN 111368861A
Authority
CN
China
Prior art keywords
subcomponent
probability
score
order
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811590549.5A
Other languages
English (en)
Other versions
CN111368861B (zh
Inventor
杨彭举
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201811590549.5A priority Critical patent/CN111368861B/zh
Publication of CN111368861A publication Critical patent/CN111368861A/zh
Application granted granted Critical
Publication of CN111368861B publication Critical patent/CN111368861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种在图像物体检测过程中确定子部件顺序的方法和装置,属于图像检测领域。所述方法包括:基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于样本集中的负样本,确定每个子部件对应的第二得分概率密度函数;基于子部件顺序中第一位次对应的预设的参考概率,确定第一位次对应的子部件;对于子部件顺序中第一位次之后的每个位次,基于当前位次的前一个位次对应的参考概率和负参考概率、每个子部件对应的第一得分概率密度函数和每个子部件对应的第二得分概率密度函数,确定当前位次对应的参考概率,确定当前位次对应的子部件。采用本申请,可以提高确定的子部件顺序的准确率。

Description

在图像物体检测过程中确定子部件顺序的方法和装置
技术领域
本申请涉及图像检测领域,特别涉及一种在图像物体检测过程中确定子部件顺序的方法和装置。
背景技术
DPM(deformable part model,可形变部件模型)是一种基于组件的目标检测算法,该算法普遍用于图像识别领域,如行人检测、车辆检测等方面。例如,在对行人进行检测时,可以将路边的监控摄像头拍摄的图像作为待检测图像,而目标类型为人类,通过DPM算法可以确定待检测图像中是否包括行人,进而确定人流量等数据。
在使用DPM算法对待检测图像进行检测时,在待检测图像中先确定可能存在物体的图像区域,将其确定为根部件,然后在根部件中确定出多个局部特征的图像区域,将每个局部特征的图像区域确定为子部件,如图1所示。确定出各子部件后,按照预设的子部件顺序,根据每个子部件相对于根部件的位移计算子部件的子部件得分,位移越大,代表形变越大,子部件得分越低。然后,将该子部件的子部件得分与对应的预设阈值进行比较,如果该子部件的子部件得分小于对应的预设阈值,说明该子部件是检测类型的物体的局部特征的可能性很小,则可以直接跳出检测,确定待检测物体不是检测类型的物体。如果该子部件的子部件得分不小于对应的预设阈值,说明该子部件是检测类型的物体的局部特征的可能性较大,则可以继续检测下一个子部件。直到计算出所有子部件的子部件得分后,确定上述图像区域中存在目标类型的物体。
在上述确定每个子部件的子部件得分的过程中,子部件顺序可以影响跳出检测的时间,进而影响进行目标检测的效率。目前确定子部件顺序的方法是:预先设置一个初始的参考概率,该参考概率用于指示某个目标样本是正样本的概率,将参考概率输入预先训练的机器学习模型,确定子部件顺序中第一位次的子部件(机器学习模型经过训练后的功能在于能够发现:对于某位次、某参考概率,使用哪个子部件更容易发现负样本),然后,技术人员基于确定出的子部件,为参考概率估计一个调整系数,基于调整系数对参考概率进行调整,进而基于调整后的参考概率和机器学习模型,确定第二位次的子部件,依次类推确定子部件顺序。
在实现本申请的过程中,发明人发现现有技术至少存在以下问题:
上述在图像物体检测过程中确定子部件顺序时,技术人员需要机遇经验确定调整系数,采用人为设置的方式使得调整系数可能存在较大误差,导致最终确定出的子部件顺序不准确。
发明内容
为了解决现有技术的问题,本申请实施例提供了一种在图像物体检测过程中确定子部件顺序的方法和装置。所述技术方案如下:
第一方面,提供了一种在图像物体检测过程中确定子部件顺序的方法,所述方法包括:
基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于所述样本集中的负样本,确定每个子部件对应的第二得分概率密度函数;
基于子部件顺序中第一位次对应的预设的参考概率,确定所述第一位次对应的子部件,其中,所述参考概率用于指示目标样本是正样本的概率,所述目标样本是所述样本集中的任意样本;
对于子部件顺序中第一位次之后的每个位次,基于当前位次的前一个位次对应的参考概率、所述每个子部件对应的第一得分概率密度函数和所述每个子部件对应的第二得分概率密度函数,确定所述当前位次对应的参考概率,基于所述当前位次对应的参考概率,确定所述当前位次对应的子部件。
可选地,所述基于子部件顺序中第一位次对应的预设的参考概率,确定所述第一位次对应的子部件,包括:
根据子部件顺序中第一位次对应的预设的参考概率、第一位次的位次标识以及预先训练的子部件确定模型,确定所述第一位次对应的子部件。
可选地,所述第一位次对应的预设的参考概率为百分之五十。
可选地,所述基于当前位次的前一个位次对应的参考概率、所述每个子部件对应的第一得分概率密度函数和所述每个子部件对应的第二得分概率密度函数,确定所述当前位次对应的参考概率,包括:
获取当前位次的前一个位次对应的已确定的目标子部件;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第一得分概率密度函数,得到第一概率密度值;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第二得分概率密度函数,得到第二概率密度值;
基于当前位次的前一个位次对应的参考概率、负参考概率、所述第一概率密度值和所述第二概率密度值,确定所述当前位次对应的参考概率,其中,所述负参考概率用于指示目标样本是负样本的概率。
可选地,所述基于当前位次的前一个位次对应的参考概率、负参考概率、所述第一概率密度值和所述第二概率密度值,确定所述当前位次对应的参考概率,包括:
根据公式
Figure BDA0001920147270000031
确定所述当前位次对应的参考概率;
其中,Pt+1是所述当前位次对应的参考概率,ht表示所述第一概率密度值,gt表示所述第二概率密度值,pt表示当前位次的前一个位次对应的参考概率,qt表示当前位次的前一个位次对应的负参考概率。
可选地,所述基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于所述样本集中的负样本,确定每个子部件对应的第二得分概率密度函数,包括:
获取样本集中的正样本,基于每个正样本的每个子部件得分,确定正样本的每个子部件的得分集合;
获取所述样本集中的负样本,基于每个负样本的每个子部件得分,确定负样本的每个子部件的得分集合;
根据所述正样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第一得分概率密度函数,根据所述负样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第二得分概率密度函数。
第二方面,提供了一种在图像物体检测过程中确定子部件顺序的装置,所述装置包括:
确定模块,用于基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于所述样本集中的负样本,确定每个子部件对应的第二得分概率密度函数;
所述确定模块,还用于基于子部件顺序中第一位次对应的预设的参考概率,确定所述第一位次对应的子部件,其中,所述参考概率用于指示目标样本是正样本的概率,所述目标样本是所述样本集中的任意样本;
所述确定模块,还用于对于子部件顺序中第一位次之后的每个位次,基于当前位次的前一个位次对应的参考概率、所述每个子部件对应的第一得分概率密度函数和所述每个子部件对应的第二得分概率密度函数,确定所述当前位次对应的参考概率,基于所述当前位次对应的参考概率,确定所述当前位次对应的子部件。
可选地,所述确定模块,用于:
根据子部件顺序中第一位次对应的预设的参考概率、第一位次的位次标识以及预先训练的子部件确定模型,确定所述第一位次对应的子部件。
可选地,所述第一位次对应的预设的参考概率为百分之五十。
可选地,所述确定模块,用于:
获取当前位次的前一个位次对应的已确定的目标子部件;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第一得分概率密度函数,得到第一概率密度值;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第二得分概率密度函数,得到第二概率密度值;
基于当前位次的前一个位次对应的参考概率、负参考概率、所述第一概率密度值和所述第二概率密度值,确定所述当前位次对应的参考概率,其中,所述负参考概率用于指示目标样本是负样本的概率。
可选地,所述确定模块,用于:
根据公式
Figure BDA0001920147270000041
确定所述当前位次对应的参考概率;
其中,Pt+1是所述当前位次对应的参考概率,ht表示所述第一概率密度值,gt表示所述第二概率密度值,pt表示当前位次的前一个位次对应的参考概率,qt表示当前位次的前一个位次对应的负参考概率。
可选地,所述确定模块,用于:
获取样本集中的正样本,基于每个正样本的每个子部件得分,确定正样本的每个子部件的得分集合;
获取所述样本集中的负样本,基于每个负样本的每个子部件得分,确定负样本的每个子部件的得分集合;
根据所述正样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第一得分概率密度函数,根据所述负样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第二得分概率密度函数。
第三方面,提供了一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现如第一方面所述的在图像物体检测过程中确定子部件顺序的方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述第一方面所述的在图像物体检测过程中确定子部件顺序的方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例中,通过当前位次的前一个位次对应的参考概率、每个子部件对应的第一得分概率密度函数和每个子部件对应的第二得分概率密度函数,确定当前位次对应的参考概率,可以通过该计算方式确定子部件顺序中每个位次对应的参考概率,相对于人为设置的方式可以减小误差,进而提高确定出的子部件顺序的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种在图像物体检测过程中确定子部件顺序的界面示意图;
图2是本申请实施例提供的一种在图像物体检测过程中确定子部件顺序的方法流程图;
图3是本申请实施例提供的一种在图像物体检测过程中确定子部件顺序的界面示意图;
图4是本申请实施例提供的一种在图像物体检测过程中确定子部件顺序的装置的示意图;
图5是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供了一种在图像物体检测过程中确定子部件顺序的方法,该方法可以由计算机设备实现。在使用DPM算法进行目标图像检测之前,使用预先获取的样本集确定DPM算法中的子部件顺序,然后按照确定出的子部件顺序,调整初始DPM模型中的子部件顺序,然后,根据训练样本对初始DPM模型进行训练,得到训练好的DPM模型。用户将待检测图像输入到DPM模型,就可以确定待检测图像中是否包括目标类型的物体。如图2所示,该方法的处理流程可以包括如下的步骤:
在步骤201中,基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于样本集中的负样本,确定每个子部件对应的第二得分概率密度函数。
一个可能的实施例中,获取预先准备的样本集,该训练样本集中包括多个正样本以及多个负样本以及每个样本的每个子部件的得分。根据样本集中的每个正样本的每个子部件得分,确定每个子部件对应的第一得分概率密度函数,同样地,根据样本集中的每个负样本的每个子部件得分,确定每个子部件对应的第二得分概率密度函数。
可选地,可以通过样本集中的样本,获取样本的每个子部件的得分集合,进而确定每个子部件对应的得分概率密度函数,相应的处理步骤可以如下:获取样本集中的正样本,基于每个正样本的每个子部件得分,确定正样本的每个子部件的得分集合;获取样本集中的负样本,基于每个负样本的每个子部件得分,确定负样本的每个子部件的得分集合;根据正样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第一得分概率密度函数,根据负样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第二得分概率密度函数。
一个可能的实施例中,获取预先准备的训练样本集,该训练样本集中包括多个正样本以及多个负样本,对于每个正样本,根据每个样本的每个子部件与根部件的位移,如图3所示,确定每个正样本的每个子部件的得分,这样,得到了整个正样本中每个子部件的得分集合。根据每个子部件的得分集合,可以得到正样本的每个子部件对应的得分概率密度函数。同样的,也可以得到整个负样本中每个子部件的得分集合,根据负样本的每个子部件对应的得分概率密度函数。
然后,对正样本对应的多个子部件对应的得分概率密度函数进行KDE(KernelDensity Estimation,核密度估计算法)来获得一个平滑的概率密度函数,即得到一个联合的第一得分概率密度函数。同理,对负样本对应的多个子部件对应的得分概率密度函数进行KDE来获得一个平滑的概率密度函数,即得到一个联合的第二得分概率密度函数。
举例来说,假设正样本的每个子部件得分集合为mi,正样本的每个子部件得分集合对应的概率密度函数为
Figure BDA0001920147270000071
则第一概率密度函数为
Figure BDA0001920147270000072
同理,则第二概率密度函数为
Figure BDA0001920147270000073
在步骤202中,基于子部件顺序中第一位次对应的预设的参考概率,确定第一位次对应的子部件。
其中,参考概率用于指示目标样本是正样本的概率,目标样本是样本集中的任意样本。
一个可能的实施例中,通过上述步骤确定第一得分概率密度函数以及第二得分概率密度函数后,在样本集中随机抽取一个样本作为目标样本,根据该目标样本确定子部件顺序。
在根据目标样本确定子部件顺序时,采用的是迭代的是思想,根据当前位次的前一个位次已经确定的子部件来确定当前位次对应的子部件。然而在计算第一位次对应的子部件时,没有前一个位次已经确定的子部件,因此,第一位次对应参考概率可以预先设定,根据第一位次对应的预设的参考概率确定第一位次对应的子部件。
可选地,通常来讲,上述第一位次对应的预设的参考概率可以设置为百分之五十,这样,预设当前目标样本为正样本的概率以及当前目标样本为负样本的概率各位百分之五十,根据该第一位次对应的参考概率确定出的第一位次对应的子部件更满足要求。
可选地,确定第一位次对应的参考概率后,上述步骤102的处理过程可以如下:根据子部件顺序中第一位次对应的预设的参考概率、第一位次的位次标识以及预先训练的子部件确定模型,确定第一位次对应的子部件。
一个可能的实施例中,确定第一位次对应的预设的参考概率后,将第一位次对应的参考概率以及第一位次的位次标识输入到预先训练的子部件确定模型中,通过子部件确定模型的运算,可以得到第一位次对应的子部件标识,进而确定第一位次对应的子部件。
需要说明的是,使用训练样本对初始子部件确定模型进行训练时,相当于训练一个函数(可以称这个函数为policy函数),该函数为:
Figure BDA0001920147270000081
其中,π表示输入值,s表示当前位次的位次标识,p表示当前位次的前一个位次对应的参考概率,n表示子部件的总个数。
这个函数可以表示根据当前位次的前一个位次已确定的子部件以及已确定的子部件的参考概率,来确定当前位次是进行正负样本的判断,或继续选择下一个子部件。该policy函数应该满足选出的子部件不能重复。
在训练时,相当于对所有训练样本进行遍历,并确定出最合理的policy函数,可以采用PAC(Probably Approximatly Corrent,概率近似正确)的理论框架进行训练,确定最优解,进而完成对初始模型的训练。
给定出错误差∈>0,要选择的policyπ,需要具有最小的跳出时间期望以及上限为∈的出错概率,即:
Figure BDA0001920147270000082
s.t.Pe(π)≤∈
其中,期望是正、负样本中的所有子部件的平均值。
如果∈太小,可能无法获得解,因此引入一个松弛因子λ:
Figure BDA0001920147270000091
λ可以看作对错误的惩罚,因此目标函数中的期望可以写成:
Figure BDA0001920147270000092
最后,将正、负样本分错的惩罚分开为λfp和λfn,目标函数变为:
Figure BDA0001920147270000093
求解这一问题可以使用动态规划方法,设:
Figure BDA0001920147270000094
则最优解为:
Figure BDA0001920147270000095
Figure BDA0001920147270000096
对于最终状态是容易求解的,即当t=n+1时,最优解为:
Figure BDA0001920147270000097
这相当于是动态规划的初始解,然后可以找出状态转移方程:
Figure BDA0001920147270000098
其中,A(st)为剩余没有选择的子部件集合。如果第一项最小,则
Figure BDA0001920147270000099
即为负样本,如果第二项最小,则
Figure BDA00019201472700000910
即为正样本,如果第三项最小,则取使得
Figure BDA00019201472700000911
最小的那个子部件k。按照上述步骤即可完成对初始子部件确定模型的训练。
在步骤103中,对于子部件顺序中第一位次之后的每个位次,基于当前位次的前一个位次对应的参考概率、每个子部件对应的第一得分概率密度函数和每个子部件对应的第二得分概率密度函数,确定当前位次对应的参考概率,基于当前位次对应的参考概率,确定当前位次对应的子部件。
一个可能的实施例中,通过上述步骤确定第一位次对应的子部件后,对于第一位次之后的每个位次,基于迭代的思想,可以获取当前位次的前一个位次对应的参考概率、每个子部件对应的第一得分率密度函数和每个子部件对应的第二得分概率密度函数,计算当前位次对应的参考概率。其中,负参考概率可以根据参考概率得到,例如,负参考概率可以为100%减去参考概率的差值。然后将当前位次对应的参考概率输入预先训练的子部件确定模型中,通过子部件确定模型的运算,可以得到当前位次对应的子部件标识,进而确定第一位次对应的子部件。
可选地,根据当前位次的前一个位次的概率密度值,确定当前位次对应的参考概率,上述步骤203的相应处理步骤可以如下:获取当前位次的前一个位次对应的已确定的目标子部件;将目标样本的目标子部件的子部件得分,输入目标子部件对应的第一得分概率密度函数,得到第一概率密度值;将目标样本的目标子部件的子部件得分,输入目标子部件对应的第二得分概率密度函数,得到第二概率密度值;基于当前位次的前一个位次对应的参考概率、负参考概率、第一概率密度值和第二概率密度值,确定当前位次对应的参考概率,其中,负参考概率用于指示目标样本是负样本的概率。
一个可能的实施例中,基于迭代的思想,在计算当前位次的参考概率时,获取当前位次的前一个位次对应的以确定的目标子部件,并获取目标子部件的子部件得分,将该子部件得分输入预先确定的第一得分概率密度函数,可以得到当前位次的前一个位次的子部件为正样本的训练样本的概率密度值,即为第一概率密度值。同样地,将目标子部件的子部件得分输入预先确定的第二得分概率密度函数,可以得到当前位次的前一个位次的子部件为负样本的训练样本的概率密度值,即为第二概率密度值。
然后,根据当前位次的前一个位次对应的参考概率,确定当前位次的前一个位次对应的负参考概率。最后,根据当前位次的前一个位次对应的参考概率、负参考概率、第一概率密度值和第二概率密度值来确定当前位次对应的参考概率。
可选地,在确定当前位次的前一个位次的目标子部件后,可以将目标子部件的参考概率看作是先验概率,而目标子部件的概率密度值可以看作是条件概率,基于贝叶斯公式,可以按照下述公式确定当前位次对应的参考概率:根据公式
Figure BDA0001920147270000101
确定当前位次对应的参考概率。
其中,Pt+1是当前位次对应的参考概率,ht表示第一概率密度值,gt表示第二概率密度值,pt表示当前位次的前一个位次对应的参考概率,qt表示当前位次的前一个位次对应的负参考概率。
本申请实施例中,通过当前位次的前一个位次对应的参考概率、每个子部件对应的第一得分概率密度函数和每个子部件对应的第二得分概率密度函数,确定当前位次对应的参考概率,可以通过该计算方式确定子部件顺序中每个位次对应的参考概率,相对于人为设置的方式可以减小误差,进而提高确定出的子部件顺序的准确性。
通过上述步骤确定子部件顺序后,按照确定的子部件顺序,对初始DPM模型中的子部件顺序进行调整,然后对初始DPM模型进行训练,训练后的DPM模型可以用于目标图像检测。
在对初始DPM模型进行训练时,可以使用L1正则化来学习稀疏的DPM模型,将DPM的学习算法即Latent SVM(Latent Support Vector Machine,一种支持向量机算法的扩展算法)从L2正则化扩展到L1,可以称之为L1-lsvm。
L1-lsvm的关键是使用L1正则项替换L2正则项,即通过如下的目标函数来学习一个稀疏的DPM:
Figure BDA0001920147270000111
令φi(β)=Φ(xi,argmaxz∈Z(xi)(β·Φ(xi,Z)))为样本xi的得分最大的特征向量,并且L(β,ζi(β))=max(0,1-yi fβ(xi))为hinge loss(一种损失函数),其中,ζi(β)=(φi(β),yi),则目标函数可以写成:
β*=argminβR(β,C)
Figure BDA0001920147270000112
L1-lsvm的训练方法与DPM的训练方法一样,因为目标函数都是半凸的,但是,L1-lsvm的优化方法不同于L2,因为||β||1不是处处可导的。所以使用SSGD(stochastic sub-gradient descent,随机子梯度下降法)来求解L1-lsvm的目标函数优化问题。
但是,常用的SSGD算法并不能得到稀疏的β*,这是因为β*的元素是浮点数,而浮点数的操作不能严格得到零,因此,需要对浮点数进行截断操作,这种优化方法被称为随机截断子梯度下降。
随机截断子梯度下降算法是一个迭代的算法,在每一步,算法都会选择训练样本的一个子集来估算子梯度,然后用子梯度的负方向来更新参数。L1-lsvm的目标函数的子梯度为:
Figure BDA0001920147270000113
其中,
Figure BDA0001920147270000121
选择使用一个样本来估算子梯度,然后将参数更新分为两个阶段,即hinge loss部分以及正则化部分。
Figure BDA0001920147270000122
Figure BDA0001920147270000123
随着迭代的不断进行,β中某些元素会渐渐的接近于0,但由于浮点数的原因,它们不可能等于0。如果我们简单的把这些接近0的元素强制置为0,学习到的检测器性能不会好,而且没有理论保证,因为这些元素可能仅仅是因为迭代次数过少才接近0,可能在后续的迭代中又会变大。因此,可以引入一个截断操作,对于β的第j个元素,有
Figure BDA0001920147270000124
如果β的某个元素在更新后改变了符号,则该元素被置为0。另外,为了避免陷入局部极值,截断惩罚只有在迭代K步(K=20)之后才进行一次。
当算法收敛以后,可以再进行一次强制置零:
Figure BDA0001920147270000125
其中,M是β所有元素的最大绝对值。α用来调整稀疏性。
L1-lsvm的检测流程与DPM一致,只是需要事先保存好滤波器的非零项索引,然后在滑窗过程中,对于窗口中的HOG特征,也只取非零项索引对应的那些元素,然后,该窗口的得分就是这两个向量的点乘。
通过active DPM和L1-lsvm的结合,这样可以发挥两者的优势,得到比任意一种算法更好的加速比。这样,通过稀疏学习模型对DPM算法进行训练,减少了算法的计算量。
基于相同的技术构思,本申请实施例还提供了一种在图像物体检测过程中确定子部件顺序的装置,该装置可以为上述实施例中的计算机设备,如图4所示,该装置包括确定模块410。
确定模块410,被配置为基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于所述样本集中的负样本,确定每个子部件对应的第二得分概率密度函数;
所述确定模块410,还被配置为基于子部件顺序中第一位次对应的预设的参考概率,确定所述第一位次对应的子部件,其中,所述参考概率用于指示目标样本是正样本的概率,所述目标样本是所述样本集中的任意样本;
所述确定模块410,还被配置为对于子部件顺序中第一位次之后的每个位次,基于当前位次的前一个位次对应的参考概率、所述每个子部件对应的第一得分概率密度函数和所述每个子部件对应的第二得分概率密度函数,确定所述当前位次对应的参考概率,基于所述当前位次对应的参考概率,确定所述当前位次对应的子部件。
可选地,所述确定模块410,被配置为:
根据子部件顺序中第一位次对应的预设的参考概率、第一位次的位次标识以及预先训练的子部件确定模型,确定所述第一位次对应的子部件。
可选地,所述第一位次对应的预设的参考概率为百分之五十。
可选地,所述确定模块410,被配置为:
获取当前位次的前一个位次对应的已确定的目标子部件;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第一得分概率密度函数,得到第一概率密度值;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第二得分概率密度函数,得到第二概率密度值;
基于当前位次的前一个位次对应的参考概率、负参考概率、所述第一概率密度值和所述第二概率密度值,确定所述当前位次对应的参考概率,其中,所述负参考概率用于指示目标样本是负样本的概率。
可选地,所述确定模块410,被配置为:
根据公式
Figure BDA0001920147270000131
确定所述当前位次对应的参考概率;
其中,Pt+1是所述当前位次对应的参考概率,ht表示所述第一概率密度值,gt表示所述第二概率密度值,pt表示当前位次的前一个位次对应的参考概率,qt表示当前位次的前一个位次对应的负参考概率。
可选地,所述确定模块410,被配置为:
获取样本集中的正样本,基于每个正样本的每个子部件得分,确定正样本的每个子部件的得分集合;
获取所述样本集中的负样本,基于每个负样本的每个子部件得分,确定负样本的每个子部件的得分集合;
根据所述正样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第一得分概率密度函数,根据所述负样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第二得分概率密度函数。
本申请实施例中,通过当前位次的前一个位次对应的参考概率、每个子部件对应的第一得分概率密度函数和每个子部件对应的第二得分概率密度函数,确定当前位次对应的参考概率,可以通过该计算方式确定子部件顺序中每个位次对应的参考概率,相对于人为设置的方式可以减小误差,进而提高确定出的子部件顺序的准确性。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是:上述实施例提供的在图像物体检测过程中确定子部件顺序的装置在在图像物体检测过程中确定子部件顺序时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的在图像物体检测过程中确定子部件顺序的装置与在图像物体检测过程中确定子部件顺序的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,存储介质中存储有至少一条指令,至少一条指令由处理器加载并执行以实现上述实施例中的在图像物体检测过程中确定子部件顺序的方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本申请实施例提供的一种计算机设备的结构示意图,该计算机设备可以是上述实施例中的计算机设备。该计算机设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)501和一个或一个以上的存储器502,其中,所述存储器502中存储有至少一条指令,所述至少一条指令由所述处理器501加载并执行以实现上述在图像物体检测过程中确定子部件顺序的方法步骤。
本申请实施例中,通过当前位次的前一个位次对应的参考概率、每个子部件对应的第一得分概率密度函数和每个子部件对应的第二得分概率密度函数,确定当前位次对应的参考概率,可以通过该计算方式确定子部件顺序中每个位次对应的参考概率,相对于人为设置的方式可以减小误差,进而提高确定出的子部件顺序的准确性。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (12)

1.一种在图像物体检测过程中确定子部件顺序的方法,其特征在于,所述方法包括:
基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于所述样本集中的负样本,确定每个子部件对应的第二得分概率密度函数;
基于子部件顺序中第一位次对应的预设的参考概率,确定所述第一位次对应的子部件,其中,所述参考概率用于指示目标样本是正样本的概率,所述目标样本是所述样本集中的任意样本;
对于子部件顺序中第一位次之后的每个位次,基于当前位次的前一个位次对应的参考概率、所述每个子部件对应的第一得分概率密度函数和所述每个子部件对应的第二得分概率密度函数,确定所述当前位次对应的参考概率,基于所述当前位次对应的参考概率,确定所述当前位次对应的子部件。
2.根据权利要求1所述的方法,其特征在于,所述基于子部件顺序中第一位次对应的预设的参考概率,确定所述第一位次对应的子部件,包括:
根据子部件顺序中第一位次对应的预设的参考概率、第一位次的位次标识以及预先训练的子部件确定模型,确定所述第一位次对应的子部件。
3.根据权利要求1所述的方法,其特征在于,所述第一位次对应的预设的参考概率为百分之五十。
4.根据权利要求1所述的方法,其特征在于,所述基于当前位次的前一个位次对应的参考概率、所述每个子部件对应的第一得分概率密度函数和所述每个子部件对应的第二得分概率密度函数,确定所述当前位次对应的参考概率,包括:
获取当前位次的前一个位次对应的已确定的目标子部件;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第一得分概率密度函数,得到第一概率密度值;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第二得分概率密度函数,得到第二概率密度值;
基于当前位次的前一个位次对应的参考概率、负参考概率、所述第一概率密度值和所述第二概率密度值,确定所述当前位次对应的参考概率,其中,所述负参考概率用于指示目标样本是负样本的概率。
5.根据权利要求4所述的方法,其特征在于,所述基于当前位次的前一个位次对应的参考概率、负参考概率、所述第一概率密度值和所述第二概率密度值,确定所述当前位次对应的参考概率,包括:
根据公式
Figure FDA0001920147260000021
确定所述当前位次对应的参考概率;
其中,Pt+1是所述当前位次对应的参考概率,ht表示所述第一概率密度值,gt表示所述第二概率密度值,pt表示当前位次的前一个位次对应的参考概率,qt表示当前位次的前一个位次对应的负参考概率。
6.根据权利要求1所述的方法,其特征在于,所述基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于所述样本集中的负样本,确定每个子部件对应的第二得分概率密度函数,包括:
获取样本集中的正样本,基于每个正样本的每个子部件得分,确定正样本的每个子部件的得分集合;
获取所述样本集中的负样本,基于每个负样本的每个子部件得分,确定负样本的每个子部件的得分集合;
根据所述正样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第一得分概率密度函数,根据所述负样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第二得分概率密度函数。
7.一种在图像物体检测过程中确定子部件顺序的装置,其特征在于,所述装置包括:
确定模块,用于基于样本集中的正样本,确定每个子部件对应的第一得分概率密度函数,并基于所述样本集中的负样本,确定每个子部件对应的第二得分概率密度函数;
所述确定模块,还用于基于子部件顺序中第一位次对应的预设的参考概率,确定所述第一位次对应的子部件,其中,所述参考概率用于指示目标样本是正样本的概率,所述目标样本是所述样本集中的任意样本;
所述确定模块,还用于对于子部件顺序中第一位次之后的每个位次,基于当前位次的前一个位次对应的参考概率、所述每个子部件对应的第一得分概率密度函数和所述每个子部件对应的第二得分概率密度函数,确定所述当前位次对应的参考概率,基于所述当前位次对应的参考概率,确定所述当前位次对应的子部件。
8.根据权利要求7所述的装置,其特征在于,所述确定模块,用于:
根据子部件顺序中第一位次对应的预设的参考概率、第一位次的位次标识以及预先训练的子部件确定模型,确定所述第一位次对应的子部件。
9.根据权利要求7所述的装置,其特征在于,所述第一位次对应的预设的参考概率为百分之五十。
10.根据权利要求7所述的装置,其特征在于,所述确定模块,用于:
获取当前位次的前一个位次对应的已确定的目标子部件;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第一得分概率密度函数,得到第一概率密度值;
将所述目标样本的所述目标子部件的子部件得分,输入所述目标子部件对应的第二得分概率密度函数,得到第二概率密度值;
基于当前位次的前一个位次对应的参考概率、负参考概率、所述第一概率密度值和所述第二概率密度值,确定所述当前位次对应的参考概率,其中,所述负参考概率用于指示目标样本是负样本的概率。
11.根据权利要求10所述的装置,其特征在于,所述确定模块,用于:
根据公式
Figure FDA0001920147260000031
确定所述当前位次对应的参考概率;
其中,Pt+1是所述当前位次对应的参考概率,ht表示所述第一概率密度值,gt表示所述第二概率密度值,pt表示当前位次的前一个位次对应的参考概率,qt表示当前位次的前一个位次对应的负参考概率。
12.根据权利要求7所述的装置,其特征在于,所述确定模块,用于:
获取样本集中的正样本,基于每个正样本的每个子部件得分,确定正样本的每个子部件的得分集合;
获取所述样本集中的负样本,基于每个负样本的每个子部件得分,确定负样本的每个子部件的得分集合;
根据所述正样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第一得分概率密度函数,根据所述负样本的每个子部件的得分集合以及核密度估计算法,生成每个子部件对应的第二得分概率密度函数。
CN201811590549.5A 2018-12-25 2018-12-25 在图像物体检测过程中确定子部件顺序的方法和装置 Active CN111368861B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811590549.5A CN111368861B (zh) 2018-12-25 2018-12-25 在图像物体检测过程中确定子部件顺序的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811590549.5A CN111368861B (zh) 2018-12-25 2018-12-25 在图像物体检测过程中确定子部件顺序的方法和装置

Publications (2)

Publication Number Publication Date
CN111368861A true CN111368861A (zh) 2020-07-03
CN111368861B CN111368861B (zh) 2023-05-09

Family

ID=71211362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811590549.5A Active CN111368861B (zh) 2018-12-25 2018-12-25 在图像物体检测过程中确定子部件顺序的方法和装置

Country Status (1)

Country Link
CN (1) CN111368861B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243356A (zh) * 2015-09-10 2016-01-13 北京大学 一种建立行人检测模型的方法及装置及行人检测方法
WO2016033965A1 (zh) * 2014-09-05 2016-03-10 华为技术有限公司 图像分类器的生成方法、图像分类方法和装置
CN106778665A (zh) * 2016-12-29 2017-05-31 浙江大华技术股份有限公司 一种车窗检测方法及装置
CN106815595A (zh) * 2015-11-27 2017-06-09 展讯通信(天津)有限公司 移动终端及其目标检测方法及装置
CN108228700A (zh) * 2017-09-30 2018-06-29 北京市商汤科技开发有限公司 图像描述模型的训练方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016033965A1 (zh) * 2014-09-05 2016-03-10 华为技术有限公司 图像分类器的生成方法、图像分类方法和装置
CN105243356A (zh) * 2015-09-10 2016-01-13 北京大学 一种建立行人检测模型的方法及装置及行人检测方法
CN106815595A (zh) * 2015-11-27 2017-06-09 展讯通信(天津)有限公司 移动终端及其目标检测方法及装置
CN106778665A (zh) * 2016-12-29 2017-05-31 浙江大华技术股份有限公司 一种车窗检测方法及装置
CN108228700A (zh) * 2017-09-30 2018-06-29 北京市商汤科技开发有限公司 图像描述模型的训练方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
戚隆宁;胡晨;张哲;卜爱国;: "基于时间期望表的DPM预测策略" *

Also Published As

Publication number Publication date
CN111368861B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
US10552737B2 (en) Artificial neural network class-based pruning
US10909455B2 (en) Information processing apparatus using multi-layer neural network and method therefor
JP2019528502A (ja) パターン認識に適用可能なモデルを最適化するための方法および装置ならびに端末デバイス
CN110969251B (zh) 基于无标签数据的神经网络模型量化方法及装置
CN109271958B (zh) 人脸年龄识别方法及装置
JP6610278B2 (ja) 機械学習装置、機械学習方法及び機械学習プログラム
CN113168559A (zh) 机器学习模型的自动化生成
US20110288835A1 (en) Data processing device, data processing method and program
US9842279B2 (en) Data processing method for learning discriminator, and data processing apparatus therefor
CN110135505B (zh) 图像分类方法、装置、计算机设备及计算机可读存储介质
CN111105017A (zh) 神经网络量化方法、装置及电子设备
US10115208B2 (en) Image characteristic estimation method and device
CN113505797B (zh) 模型训练方法、装置、计算机设备和存储介质
CN111695624A (zh) 数据增强策略的更新方法、装置、设备及存储介质
CN112132278A (zh) 模型压缩方法、装置、计算机设备及存储介质
CN110826692B (zh) 一种自动化模型压缩方法、装置、设备及存储介质
CN115438804A (zh) 预测模型训练方法、装置、设备以及图像预测方法
US11914672B2 (en) Method of neural architecture search using continuous action reinforcement learning
CN111260056B (zh) 一种网络模型蒸馏方法及装置
CN114358274A (zh) 训练用于图像识别的神经网络的方法和设备
CN113011532A (zh) 分类模型训练方法、装置、计算设备及存储介质
CN113222014A (zh) 图像分类模型训练方法、装置、计算机设备和存储介质
CN111368861A (zh) 在图像物体检测过程中确定子部件顺序的方法和装置
CN115410250A (zh) 阵列式人脸美丽预测方法、设备及存储介质
CN114970732A (zh) 分类模型的后验校准方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant