CN103295031A - 一种基于正则风险最小化的图像目标计数方法 - Google Patents
一种基于正则风险最小化的图像目标计数方法 Download PDFInfo
- Publication number
- CN103295031A CN103295031A CN201310128763XA CN201310128763A CN103295031A CN 103295031 A CN103295031 A CN 103295031A CN 201310128763X A CN201310128763X A CN 201310128763XA CN 201310128763 A CN201310128763 A CN 201310128763A CN 103295031 A CN103295031 A CN 103295031A
- Authority
- CN
- China
- Prior art keywords
- image
- density function
- risk minimization
- pixel
- canonical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种基于正则风险最小化的图像目标计数方法,包括以下步骤:使用的每张训练图像设置有相应的对目标进行人工标注的标记点图像,标记点图像以像素点标记的方式给出每个目标的位置;对训练图像定义密度函数;根据密度函数的定义,将训练图像对应的标记点图像与一个高斯模板卷积即得到真实密度函数;由密度函数的定义构造密度函数的参数化模型;由正则化风险最小化求取密度函数模型的参数w;将正则化风险最小化问题转化为一个线性规划问题,求得密度函数模型的参数w。本发明以一种简单的模型来描述空间信息,得到一个可以适用于不同密集程度的群体,且可以给出图像中任意区域内的目标个数的计数方法。
Description
技术领域
本发明属于图像处理技术领域,特别地涉及一种基于正则风险最小化的图像目标计数方法。
背景技术
目标计数旨在得到某一场景中目标数目的估计。目标计数具有广泛的应用,如估计监控视频中的人群密度以对高密度情况进行警报,预防事故;估计血检、尿检图片中的细胞个数以诊断被试者是否患有疾病等。该领域目前的主要难点在于解决高密度群体和复杂场景下的目标计数。
现有的目标计数方法主要可分为两类:基于目标检测的方法和基于回归分析的方法。基于目标检测的方法需要检测出图像中的每个目标,比如利用哈尔Haar小波变换寻找具有类似人头边缘的物体,确定场景中的个体数目。这类方法的问题在于无法处理遮挡、黏连等带来的检测困难,不适用于高密度群体和复杂场景。基于回归分析的方法旨在找出某个图像区域的全局特征描述与该区域中的目标个数之间的关系。这种关系可以通过各种机器学习方法得到。由于不同密度群体的特征差异较大,根据群体密度的不同,常采用不同的特征描述,这又将此类方法分为基于像素的方法和基于纹理的方法。对于中低密度的群体,由于前景像素的面积与目标个数成近似的线性关系,多采用基于像素的方法,利用减背景、马尔科夫随机场和光流法等分割出前景像素,然后采用最小二乘拟合、卡尔曼滤波器和神经网络等得到模型的参数。但是对于高密度群体,由于遮挡、黏连等问题,前景像素的面积与目标个数不再具有可靠的相关性,这时多采用基于纹理的方法,如采用灰度共生矩阵及其改进、小波分解系数矩阵的能量、切比雪夫Chebyshev矩等描述纹理特征,利用神经网络、支持向量机 (Support Vector Machine,SVM)等学习得到特征描述到目标个数的映射关系。而在考虑中高密度群体时,现有方法基本都无法得到目标个数的精确估计,而是估计目标密度的等级(通常将密度分为由低到高的5个等级),即密度估计(density estimation)。基于回归分析的方法虽然避免了目标检测的困难,但是仍很难找到一种普遍适用于不同密度群体的特征描述和学习方法。
由于现有方法使用的训练图像仅仅是已知目标个数或密度等级的图像集,而目标在图像上的空间分布是未知的,所以经过学习后,对于一张输入图像只能得到整张图像的目标个数或密度等级,而无法得到该图像中任意区域内的目标个数。最后,由于神经网络、支持向量机等方法的计算复杂较高,基本还无法做到实时处理。
发明内容
为解决上述问题,本发明的目的在于提供一种基于正则风险最小化的图像目标计数方法,将目标位置标注加入到训练集中,使用监督式学习框架,直接利用正则化风险最小化原理,通过各种简化最后归结为一个线性规划问题,以一种简单的模型来描述空间信息,得到一个可以适用于不同密集程度的群体,且可以给出图像中任意区域内的目标个数的计数方法。
为实现上述目的,本发明的技术方案为:
一种基于正则风险最小化的图像目标计数方法,包括以下步骤:
S10,使用的每张训练图像设置有相应的对目标进行人工标注的标记点图像,所述标记点图像以像素点标记的方式给出每个目标的位置;
S20,对所述训练图像定义密度函数,其中所述密度函数为定义在图像像素集上的实值函数,且所述密度函数在任意图像区域上的积分为该区域内的目标个数;
S30,根据密度函数的定义,将训练图像对应的标记点图像与一个高斯模板卷积即得到真实密度函数;
S40,由密度函数的定义构造密度函数的参数化模型,进行图像分割后,对于前景像素点将对应的特征向量做线性变换得到一个正实数,对于背景像素点直接赋零即得到该点的密度函数值;
S50,由正则化风险最小化求取密度函数模型的参数w:
S60,将正则化风险最小化问题转化为一个线性规划问题,求得密度函数模型的参数w。确定了密度函数的模型,可以估计图像上任意区域中的目标个数。
其中S为训练图像I的子区域,p为像素点,c为S内的目标个数。
优选地,S30中真实密度函数为:
优选地,S40中密度函数参数化模型为:
其中xp为像素点p的特征向量,其中T=T1∪T2∪...∪TC为所有目标区域的总和,Ti,i=l,...C为第i个目标区域。
优选地,特征向量xp为对每个像素点提取尺度不变特征变换描述子SIFT descriptor,用户可以设置是否分割图像,如果是,则分割图像后对目标像素提取稠密尺度不变特征变换描述于DSIFT特征;如果否,则对整张图像的所有像素提取DSIFT特征。
优选地,对特征向量xp进行特征降维:选取一些图片,提取DSIFT特征,对得到的特征集进行K均值聚类,保存K个聚类中心,作为一个映射码表,之后的训练和预测中,以其所属的类来表示每个SIFT特征向量xp:
优选地,S50中引入了两个密度函数的差异度量:
将每张训练图像上真实密度函数与密度函数的参数模型差异度的平均作为经验风险:
此时训练样本为每张训练图像所对应的真实密度函数。
优选地,S50中使用MESA距离作为密度函数的差异度量,MESA距离定义为,两个密度函数的积分之差的绝对值在图像的所有矩形子区域B上的最大值:
优选地,S60中求解的线性规划问题为:
最小化括号中的表达式,并使下面条件得到满足:
w≥0
其中ξi,i=l,...,N为松弛变量。
与现有技术相比,本发明的有益效果如下:
(1)在目标计数问题中加入了目标位置信息,并且引入了密度函数的概念,对目标位置信息进行简单有效的描述;
(2)直接利用正则化风险最小化原理,且通过各种简化最后归结为一个线性规划问题,计算复杂度低,能很快地得到计数结果;
(3)利用图像分割提高估计精度和处理速度;
(4)由于加入了目标位置信息,能给出图像中任意区域内的目标个数,而不仅是整张图像上的目标个数;
(5)对于高密度群体,也能给出目标计数,而不仅是密度等级估计。
附图说明
图1为本发明实施例的基于正则风险最小化的图像目标计数方法的步骤流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解, 在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
参见图1,所示为本发明实施例的一种基于正则风险最小化的图像目标计数方法的步骤流程图,包括以下步骤:
S10,使用的每张训练图像设置有相应的对目标进行人工标注的标记点图像,标记点图像以像素点标记的方式给出每个目标的位置。
S20,对训练图像定义密度函数,其中密度函数为定义在图像像素集上的实值函数,且密度函数在任意图像区域上的积分为该区域内的目标个数。
其中S为训练图像I的子区域,p为像素点,c为S内的目标个数。
S30,根据密度函数的定义,将训练图像对应的标记点图像与一个高斯模板卷积即得到真实密度函数;
真实密度函数为:
S40,由密度函数的定义构造密度函数的参数化模型,进行图像分割后,对于前景像素点将对应的特征向量做线性变换得到一个正实数,对于背景像素点直接赋零即得到该点的密度函数值;
密度函数参数化模型为:
其中xp为像素点p的特征向量,其中T=T1∪T2∪...∪TC为所有目标区域的总 和,Ti,i=1,...C为第i个目标区域。
尺度不变特征变换描述子(scale invariant feature transform descriptor,SIFT descriptor)具有对形变、光照和对比度变化的不变性,又能保留空间信息,因而本发明实施例对每个像素点提取SIFT描述子作为每个像素点的特征xp(即DSIFT描述子(Dense SIFT descriptor,稠密尺度不变特征变换描述子))。用户可以设置是否分割图像,如果是,则分割图像后对目标像素提取DSIFT特征;如果否,则对整张图像的所有像素提取DSIFT特征。
进一步的,由于SIFT描述子为一个128维特征向量,又需要对每个像素点提取,这将导致在训练和预测中遇到很大的内存瓶颈。采用如下方法进行特征降维:选取一些图片,提取DSIFT特征,对得到的特征集进行K均值聚类(K-means clustering),保存K个聚类中心,作为一个映射码表。之后的训练和预测中,以其所属的类来表示每个SIFT特征向量xp:
S50,由正则化风险最小化求取密度函数模型的参数w:
参数w为与特征向量xp维数相同的变换向量,其中项称为复杂度惩罚项或正则化惩罚项,为参数w的复杂度测度,λ为正则化常量,控制正则化强度,可通过实验选取。Remp(w)为经验风险,近似地描述了使用参数估计w密度函数时的误差的期望。
为了计算经验风险Remp(w),引入了两个密度函数的差异度量:
将每张训练图像上真实密度函数与密度函数的参数模型差异度的平均作为经验风险:
此时训练样本为每张训练图像所对应的真实密度函数。使用MESA距离作为密度函数的差异度量,MESA(Maximum Excess over Sub Arrays,子数组最大超量)距离定义为,两个密度函数的积分之差的绝对值在图像的所有矩形子区域B上的最大值:
S60,将正则化风险最小化问题转化为一个线性规划问题,求得密度函数模型的参数w。确定了密度函数的模型,可以估计图像上任意区域中的目标个数。
求解的线性规划问题为:
最小化括号中的表达式,并使下面条件得到满足:
w≥0
其中ξi,i=l,...,N为松弛变量。
该问题的约束集中对应所有可能的矩形子区域B有无限多个约束,导致上述线性规划问题无法直接求解。可以使用类似于割平面方法(cutting-plane method)的迭代过程解决这个问题,每次迭代都只取约束集的一个子集为活动约束(active constraint)求解,并在迭代过程中逐步增加约束,最终得到收敛 解。在首次迭代,随机取一些训练图片再在这些图片上取一些随机的矩形子区域,以这些子区域对应的约束求解,这是一个标准的线性规划问题。设每次迭代得到解wj,已有wj,可以计算并得到对应的最大子数组,即为一个矩形子区域并判断是否满足 其中0<ε<<1,若不满足,则将对应的约束加入活动约束集中,进入下一次迭代。如果满足,则说明已经求得了问题的收敛解,迭代结束。ε越小,得到的解越接近真实解,但需要的迭代次数也越多。
通过以上技术方案,对每张测试图像同样做预处理后,带入训练模块求得的模型参数,就可得到测试图像密度函数的估计。而对密度函数的估计在任意图像区域上积分,就得到该区域上目标数目的估计。对于高密度群体,也能给出目标计数,而不仅是密度等级估计。避免了现有技术中,对于高密度群体,只能给出密度等级估计,而不能给出目标计数的问题。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于正则风险最小化的图像目标计数方法,其特征在于,包括以下步骤:
S10,使用的每张训练图像设置有相应的对目标进行人工标注的标记点图像,所述标记点图像以像素点标记的方式给出每个目标的位置;
S20,对所述训练图像定义密度函数,其中所述密度函数为定义在图像像素集上的实值函数,且所述密度函数在任意图像区域上的积分为该区域内的目标个数;
S30,根据密度函数的定义,将训练图像对应的标记点图像与一个高斯模板卷积即得到真实密度函数;
S40,由密度函数的定义构造密度函数的参数化模型,进行图像分割后,对于前景像素点将对应的特征向量做线性变换得到一个正实数,对于背景像素点直接赋零即得到该点的密度函数值;
S50,由正则化风险最小化求取密度函数模型的参数w:
S60,将正则化风险最小化问题转化为一个线性规划问题,求得密度函数模型的参数w,确定了密度函数的模型,可以估计图像上任意区域中的目标个数。
4.根据权利要求1所述的基于正则风险最小化的图像目标计数方法,其特征在于:S40中密度函数参数化模型为:
其中xp为像素点p的特征向量,其中T=T1∪T2∪...∪TC为所有目标区域的总和,Ti,i=l,...C为第i个目标区域。
5.根据权利要求1至4任一所述的基于正则风险最小化的图像目标计数方法,其特征在于,特征向量xp为对每个像素点提取尺度不变特征变换描述子SIFT descriptor,用户可以设置是否分割图像,如果是,则分割图像后对目标像素提取稠密尺度不变特征变换描述子DSIFT特征;如果否,则对整张图像的所有像素提取DSIFT特征。
6.根据权利要求5所述的基于正则风险最小化的图像目标计数方法,其特征在于,对特征向量xp进行特征降维:选取一些图片,提取DSIFT特征,对得到的特征集进行K均值聚类,保存K个聚类中心,作为一个映射码表,之后的训练和预测中,以其所属的类来表示每个SIFT特征向量xp:
10.根据权利要求1所述的基于正则风险最小化的图像目标计数方法,其特征在于,S60中求解的线性规划问题为:
最小化括号中的表达式,并使下面条件得到满足:
w≥0
其中ξi,i=I,...,N为松弛变量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310128763.XA CN103295031B (zh) | 2013-04-15 | 2013-04-15 | 一种基于正则风险最小化的图像目标计数方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310128763.XA CN103295031B (zh) | 2013-04-15 | 2013-04-15 | 一种基于正则风险最小化的图像目标计数方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103295031A true CN103295031A (zh) | 2013-09-11 |
CN103295031B CN103295031B (zh) | 2016-12-28 |
Family
ID=49095858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310128763.XA Expired - Fee Related CN103295031B (zh) | 2013-04-15 | 2013-04-15 | 一种基于正则风险最小化的图像目标计数方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103295031B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740819A (zh) * | 2016-01-29 | 2016-07-06 | 中国科学院信息工程研究所 | 一种基于整数规划的人群密度估计方法 |
CN106204619A (zh) * | 2016-07-21 | 2016-12-07 | 浙江大华技术股份有限公司 | 一种目标对象分布密度确定方法及装置 |
CN108038084A (zh) * | 2017-12-08 | 2018-05-15 | 成都谷问信息技术有限公司 | 一种有效分类的信息处理系统 |
CN109241858A (zh) * | 2018-08-13 | 2019-01-18 | 湖南信达通信息技术有限公司 | 一种基于轨道交通列车的客流密度检测方法及装置 |
CN110516584A (zh) * | 2019-08-22 | 2019-11-29 | 杭州图谱光电科技有限公司 | 一种显微镜用的基于动态学习的细胞自动计数方法 |
CN110826581A (zh) * | 2018-08-10 | 2020-02-21 | 京东数字科技控股有限公司 | 一种动物数量识别方法、装置、介质及电子设备 |
CN112101611A (zh) * | 2020-07-31 | 2020-12-18 | 重庆锐云科技有限公司 | 房地产客户复购时间的预测方法、服务器及存储介质 |
CN112818884A (zh) * | 2021-02-07 | 2021-05-18 | 中国科学院大学 | 一种使用存储增强的人群计数方法 |
CN116129331A (zh) * | 2023-04-12 | 2023-05-16 | 成都航空职业技术学院 | 一种回转体零件表面通孔个数统计方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102360435A (zh) * | 2011-10-26 | 2012-02-22 | 西安电子科技大学 | 基于隐含主题分析的不良图像检测方法 |
US20120095947A1 (en) * | 2010-10-18 | 2012-04-19 | Electronics And Telecommunications Research Institute | Vector classifier and vector classification method thereof |
-
2013
- 2013-04-15 CN CN201310128763.XA patent/CN103295031B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120095947A1 (en) * | 2010-10-18 | 2012-04-19 | Electronics And Telecommunications Research Institute | Vector classifier and vector classification method thereof |
CN102360435A (zh) * | 2011-10-26 | 2012-02-22 | 西安电子科技大学 | 基于隐含主题分析的不良图像检测方法 |
Non-Patent Citations (1)
Title |
---|
HOLGER FROHLICH,: "Feature Subset Selection for Support Vector Machines by Incremental Regularized Risk Minimization", 《PROCEEDINGS.2004 IEEE INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS》, 31 December 2004 (2004-12-31), pages 2041 - 2045 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740819A (zh) * | 2016-01-29 | 2016-07-06 | 中国科学院信息工程研究所 | 一种基于整数规划的人群密度估计方法 |
CN106204619A (zh) * | 2016-07-21 | 2016-12-07 | 浙江大华技术股份有限公司 | 一种目标对象分布密度确定方法及装置 |
CN106204619B (zh) * | 2016-07-21 | 2019-07-16 | 浙江大华技术股份有限公司 | 一种目标对象分布密度确定方法及装置 |
CN108038084A (zh) * | 2017-12-08 | 2018-05-15 | 成都谷问信息技术有限公司 | 一种有效分类的信息处理系统 |
CN110826581A (zh) * | 2018-08-10 | 2020-02-21 | 京东数字科技控股有限公司 | 一种动物数量识别方法、装置、介质及电子设备 |
CN110826581B (zh) * | 2018-08-10 | 2023-11-07 | 京东科技控股股份有限公司 | 一种动物数量识别方法、装置、介质及电子设备 |
CN109241858A (zh) * | 2018-08-13 | 2019-01-18 | 湖南信达通信息技术有限公司 | 一种基于轨道交通列车的客流密度检测方法及装置 |
CN110516584B (zh) * | 2019-08-22 | 2021-10-08 | 杭州图谱光电科技有限公司 | 一种显微镜用的基于动态学习的细胞自动计数方法 |
CN110516584A (zh) * | 2019-08-22 | 2019-11-29 | 杭州图谱光电科技有限公司 | 一种显微镜用的基于动态学习的细胞自动计数方法 |
CN112101611A (zh) * | 2020-07-31 | 2020-12-18 | 重庆锐云科技有限公司 | 房地产客户复购时间的预测方法、服务器及存储介质 |
CN112818884A (zh) * | 2021-02-07 | 2021-05-18 | 中国科学院大学 | 一种使用存储增强的人群计数方法 |
CN116129331A (zh) * | 2023-04-12 | 2023-05-16 | 成都航空职业技术学院 | 一种回转体零件表面通孔个数统计方法及装置 |
CN116129331B (zh) * | 2023-04-12 | 2023-07-04 | 成都航空职业技术学院 | 一种回转体零件表面通孔个数统计方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103295031B (zh) | 2016-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103295031A (zh) | 一种基于正则风险最小化的图像目标计数方法 | |
CN108319964B (zh) | 一种基于混合特征和流形学习的火灾图像识别方法 | |
Yuan et al. | Factorization-based texture segmentation | |
Liu et al. | Enhancing spectral unmixing by local neighborhood weights | |
CN103413151B (zh) | 基于图正则低秩表示维数约简的高光谱图像分类方法 | |
CN103475898B (zh) | 一种基于信息熵特征的无参考图像质量评价方法 | |
Oliva et al. | Scene-centered description from spatial envelope properties | |
CN107633226B (zh) | 一种人体动作跟踪特征处理方法 | |
CN107085716A (zh) | 基于多任务生成对抗网络的跨视角步态识别方法 | |
Kim et al. | Color–texture segmentation using unsupervised graph cuts | |
Bongsoo Choy et al. | Enriching object detection with 2d-3d registration and continuous viewpoint estimation | |
Kortylewski et al. | Unsupervised footwear impression analysis and retrieval from crime scene data | |
CN102629374B (zh) | 基于子空间投影和邻域嵌入的图像超分辨率重建方法 | |
CN106650744B (zh) | 局部形状迁移指导的图像对象共分割方法 | |
ElMikaty et al. | Detection of cars in high-resolution aerial images of complex urban environments | |
CN103258324B (zh) | 基于可控核回归和超像素分割的遥感图像变化检测方法 | |
CN106127179B (zh) | 基于自适应分层多尺度的高光谱遥感图像分类方法 | |
CN107590515A (zh) | 基于熵率超像素分割的自编码器的高光谱图像分类方法 | |
CN103955926A (zh) | 基于Semi-NMF的遥感图像变化检测方法 | |
CN103440512A (zh) | 一种基于张量局部保持投影的大脑认知状态的识别方法 | |
CN108681721A (zh) | 基于图像分割二维双向数据线性相关组合的人脸识别方法 | |
CN105046714A (zh) | 一种非监督的基于超像素和目标发现机制的图像分割方法 | |
CN102592135B (zh) | 融合目标空间分布和时序分布特征子空间的视觉跟踪方法 | |
CN106157330A (zh) | 一种基于目标联合外观模型的视觉跟踪方法 | |
CN109034213B (zh) | 基于相关熵原则的高光谱图像分类方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20161228 Termination date: 20210415 |