CN106485226A - 一种基于神经网络的视频行人检测方法 - Google Patents
一种基于神经网络的视频行人检测方法 Download PDFInfo
- Publication number
- CN106485226A CN106485226A CN201610899106.9A CN201610899106A CN106485226A CN 106485226 A CN106485226 A CN 106485226A CN 201610899106 A CN201610899106 A CN 201610899106A CN 106485226 A CN106485226 A CN 106485226A
- Authority
- CN
- China
- Prior art keywords
- feature
- neutral net
- image
- video
- moving object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于神经网络的视频行人检测方法,包括以下步骤:步骤S1:提取视频中的一帧图像;步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;步骤S3:将前景运动对象图像进行归一化处理;步骤S4:在前景运动对象图像中提取HOG特征和LUV特征;步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。本发明针对HOG‑SVM算法计算量大、计算速度慢的缺点,使用神经网络算法替代SVM分类器,使用HOG和LUV特征来描述图像,在保证准确率的基础上提高处理速度;并充分利用了混合高斯背景减除法滤除背景图像;算法计算速度快,准确率高。
Description
技术领域
本发明属于智能视频监控领域,尤其涉及一种基于神经网络的视频行人检测方法。
背景技术
行人检测是一种在待检测的图像或者视频中发现行人并反馈行人位置信息和相对大小的方法。近年来行人检测在计算机视觉领域受到足够关注和重视,并且取得了很大的发展,使得行人检测的实用性获得增强。但是,在图像或视频内的行人由于运动形态、服饰穿着、拍摄时机等影响,行人的形态存在较大的变化。因此行人检测也成为了计算机视觉领域的一个研究难点。
目前有多种检测行人的方法,其中基于机器学习的检测方法比例最大。该方法包括以下两方面:特征描述算子和学习算法。特征描述算子有haar小波、HOG(HistogramofOrientedGradient)、LBP(LocalBinaryPattern)、Shapelet特征以及边缘特征(edgelet)等。学习算法有支持向量机(SVM)、神经网络等。现有的主流技术解决方案是采用HOG特征+SVM分类器的方法,该方法采取对图像采用不同大小框架扫描,对每一幅扫描获得的图像提取HOG特征并利用训练好的SVM分类器对提取的特征进行分类,由于HOG特征在光照和偏移量上有较好的鲁棒性等特点,具有最佳的代表性。但由于采用了扫描的方法提取图像,造成了效率上的大浪费,并且在SVM的处理中计算量大,导致其计算速度不理想。同时由于只使用了一种特征,对行人的特征描述不够全面,在某些特殊场合的检测正确率偏低。
故,针对目前现有技术中存在的上述缺陷,实有必要进行研究,以提供一种方案,解决现有技术中存在的缺陷。
发明内容
有鉴于此,确有必要提供一种检测速度快且准确率高的基于神经网络的视频行人检测方法。
为了克服现有技术存在的缺陷,本发明提供以下技术方案:
一种基于神经网络的视频行人检测方法,包括以下步骤:
步骤S1:提取视频中的一帧图像;
步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;
步骤S3:将前景运动对象图像进行归一化处理;
步骤S4:在前景运动对象图像中提取HOG特征和LUV特征;
步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。
优选地,所述神经网络采用无隐层结构、单隐层结构或双隐层结构。
优选地,在所述步骤S3中,将前景运动对象图像归一化到64像素*128像素大小。
优选地,在所述步骤S2中,通过混合高斯算法将当前帧图像与已有背景图像对比进而生成二值化的前景运动对象图像。
优选地,对二值化的前景运动对象图像进行膨胀腐蚀运算。
优选地,进一步包括以下步骤:
对二值化的前景运动对象图像进行一次膨胀运算;
将经第一次膨胀运算处理的图像进行多次腐蚀运算;
再将经腐蚀运算处理的图像进行多次膨胀运算。
优选地,在所述步骤S4中,还包括将提取的HOG特征及LUV特征进行PCA降维的步骤。降维处理后提取HOG特征及LUV特征中最主要的一半维度。
优选地,所述神经网络为采用单隐层结构的BP神经网络,采用优化为3780维的特征向量的输入结构、节点个数为80个的可提高检测精度的隐层结构。
与现有技术相比较,针对HOG-SVM算法计算量大,计算速度慢的缺点,本发明使用神经网络算法替代SVM分类器,使用HOG和LUV特征来描述图像,在保证准确率的基础上还提高了处理速度;同时充分利用了混合高斯背景减除法除滤除背景图像,使得算法具有计算速度快,准确率高的优点。
附图说明
图1为本发明一种基于神经网络的视频行人检测方法的流程框图。
图2为本发明用于试验使用的原始视频。
图3为图2经过混合高斯背景减除处理后的黑白二值图。
图4为图3经过一次膨胀运算处理后的黑白二值图。
图5为图4经过两次腐蚀运算处理后的黑白二值图。
图6为图5经过四次膨胀运算处理后的黑白二值图。
图7为通过本文方法处理后的行人检测结果图。
如下具体实施例将结合上述附图进一步说明本发明。
具体实施方式
以下将结合附图对本发明作进一步说明。
参见图1,所示为本发明一种基于神经网络的视频行人检测方法的流程框图,包括以下步骤:
步骤S1:提取视频中的一帧图像;
步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;
步骤S3:将前景运动对象图像进行归一化处理;
步骤S4:在前景运动对象图像中提取HOG特征和LUV特征,其中LUV特征为LUV色彩空间,全称CIE 1976(L,u,v)色彩空间,L表示物体亮度,u和v是色度。将LUV空间特征量化为1890维特征直方图,从而形成LUV直方图特征向量;
步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。
在步骤S3中,将步骤S2得到的前景运动对象图像进行归一化到64像素*128像素(以下设计HOG特征的尺寸描述的单位均为像素)大小后进行HOG特征提取。由于神经网络对输入有严格要求,因此使用归一化将采集到的前景图像统一大小以便提取相同数量的特征维数。
HOG特征提取的参数如下:检测窗口(64,128),块尺寸(16,16),块步长(8,16),cell尺寸(8,8),直方图bin个数9,最后获得共3780维特征向量。
所述神经网络是单隐层结构的BP神经网络,
在步骤S2中,通过混合高斯算法进行了图像相减除处理。该方法能屏蔽大部分周期性变化的运动目标,其模型为:
图像序列I中的某一个特定像素{X0,Y0}可以表示为Xt表示时刻t像素{X0,Y0}的值。K是高斯分布的个数,ω(i,t)是时刻t第i个高斯分布的权重,μ(i,t)是时刻t第i个高斯分布的均值,C(i,t)是时刻t第i个高斯分布的协方差矩阵,若假设红绿蓝三像素相互独立,并且有相同的方差,则协方差矩阵可以表示为定义为C(i,t)=σi 2I高斯密度公式,其形式为:
η(Xt,μ,C)=1/((2π/n/2|C|2)exp(-1/2(Xt-μt)T C-1(XT-μT)) (2)
高斯模型参数更新公式如下:
ω(k,t)=(1-α)ω(k,t-1)+α(M(k,t)) (3)
μt=(1-ρ)μ(t-1)+ρXt (4)
σt 2=(1-ρ)σ(t-1) 2+ρ(Xt-μt)T(Xt-μt) (5)
其中ρ=αη(Xt│μk,σk)。当MK,t=1即像素与某个高斯分布相匹配,则该高斯分布的权重增大,方差变小,选择权重与方差比值最高的b个高斯分布作为背景模型。某一像素与背景模型相匹配则认为该像素是背景像素,否则,则认为是前景像素,从而实现前景运动对象图像的提取。
在提取视频前景运动对象图像时,首先将视频帧进行混合高斯背景减除,得到前景为白色背景为黑色的二值图。由于光照、摄像头抖动等原因,通过混合高斯背景减除后的视频帧依然存在不少噪点。为了解决这个问题,本发明对获得的黑白二值图进行膨胀腐蚀运算。为了防止真实的前景在腐蚀运算中被切割,本发明先运用了一次膨胀运算,以在后面的腐蚀运算时保证真实前景的连贯性。在通过两次腐蚀运算将黑背二值图中的噪点去除,最后通过四次膨胀运算将真正的前景图像加强。通过膨胀——腐蚀——膨胀处理后的黑白二值图可以很好的表示前景所在区域。参见图2至图6,所示为视频在上述处理中所展 现的黑白二值图。
在步骤S4中,HOG特征提取分为了以下几个步骤:
①平方根Gamma空间和颜色空间标准化。
②像素梯度的计算。通过式(1)和式(2)分别计算像素点得到梯度的模值和方向角:
其中,G(x,y),α(x,y),H(x,y)分别表示像素点的梯度幅值、梯度方向以及像素点的灰度值。
③元内梯度直方图的统计。
④block归一化直方图。
⑤计算出HOG特征。
本发明中对获取的前景运动对象图像进行归一化到64像素*128像素大小后进行HOG特征提取,HOG特征提取的参数如下:检测窗口(64,128),块尺寸(16,16),块步长(8,16),cell尺寸(8,8),直方图bin个数9。最后获得共3780维特征向量。
在一种优选的实施方式中,将提取的HOG特征及LUV特征进行PCA(PrincipalComponent Analysis)降维,提取特征中最主要的一半维度。PCA是一种数据分析方法,通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。本发明中使用前期训练好的PCA降维参数(由训练样本特征计算后得到的平均矩阵、协方差矩阵、协方差特征向量和特征值矩阵)对HOG特征进行降维。
神经网络由于对非线性问题具有良好的分类特性,因此经常被用作分类 器。在特征选择时与遗传算法结合往往能取得非常好的效果。本发明使用了目前较为成熟的BP神经网络。
BP(Back Propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hiddenlayer)和输出层(output layer)。
在步骤S5中,预先学习和训练好上述神经网络,学习和训练如下:
本发明实施例对pets2001标准视频提供的监控视频序列进行处理。该视频中场景背景处于动态变化之中,不仅有光照变化还有不停变化的汽车,运动物体有单个行人、多个行人、各种车辆等,行人遮挡比较严重。具体包括如下步骤:
利用行人样本图片库,提取图片的HOG特征和LUV特征作为输入数据,采用神经网络学习方法生成行人的模式识别分类器。
本文使用OpenCV计算机视觉开源库和INRIA行人数据库来对算法进行验证。INRIA行人数据库为法国国家信息与自动化研究所行人数据库,训练集由正样本614张,负样本1218张构成;测试集由正样本288张,负测试样本453张构成。样本通过截取街景行人而构成,图像行人姿态多样,背景复杂多变,普遍代表了行人检测的大多数难点,适用性更强。依据INRIA行人数据库给出的行人坐标,将614张正样本截取出1237个行人图片作为正样本,1218张风景图片作为负样本。
本发明选用Qiang Zhu提出的HOG特征,通过将图像进行归一化到64像素*128像素大小后进行HOG特征提取,HOG特征提取的参数如下:检测 窗口(64,128),块尺寸(16,16),块步长(8,16),cell尺寸(8,8),直方图bin个数9,最后获得共3780维特征向量。
本发明继续对得到的所有HOG特征进行PCA降维处理。将所有训练样本的3780维HOG特征组成一个3780*(1237+1218)矩阵,计算该矩阵的协方差矩阵并求出其特征向量和特征值,将得到的特征向量和特征值按大小排序,并对排序后的前1890个特征做提取,作为新的HOG特征。
本发明选用LUV特征,通过将归一化的前景图片转换到LUV色彩空间,设置L为27色彩级别,U为7色彩级别,V为10色彩级别,最后将LUV空间特征量化为1890维特征直方图,从而形成LUV直方图特征向量。
为了确定较优的神经网络结构,本发明分别对无隐层结构(3780-2),单隐层结构(3780-90-2)和双隐层结构(3780-1900-40-2)的神经网络进行了实验。实验结果见表1。实验结果显示,无隐层结构的神经网络由于可调整空间太小,致使最后的实验结果不理想。双隐层结构的神经网络当第一层隐层的节点数目过多时会出现过拟合现象,且训练和检测时间大大增加。单隐层结构的神经网络相对于无隐层结构的神经网络其可供算法程序调整的空间较大。单隐层结构的神经网络相对于双隐层结构的神经网络不仅能够避免双隐层结构出现的过拟合问题,而且在算法的训练和检测环节其耗时大大减少。
表1各结构神经网络对比
对比上述实验结果,本发明设计了单隐层结构的BP神经网络。同时为了确定隐层节点数目,本发明分别对隐层节点数为67、72、77、78、79、80、 81、82、83、84、85、86、87的神经网络进行了测试,测试结果见表2不同隐层节点数对结果的影响。其中行人识别率为对行人图片做出正确反应的概率,非行人识别率为对非行人图片做出正确反应的概率,准确率为行人识别率加非行人识别率的平均值。
表2不同隐层节点数对结果的影响
由上表可知当隐层节点为80个时算法的准确率明显提高最终我们确定神经网络的结构为网络输入层3780维的特征向量,网络输出层为行人概率和非行人概率,隐层节点个数为80个。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在 其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (6)
1.一种基于神经网络和双特征融合的视频行人检测方法,其特征在于,包括以下步骤:
步骤S1:提取视频中的一帧图像;
步骤S2:将当前帧图像与已有背景图像对比进而生成前景运动对象图像并进行膨胀腐蚀运算;
步骤S3:将前景运动对象图像进行归一化处理;
步骤S4:在前景运动对象图像中提取HOG特征和LUV特征;
步骤S5:将HOG特征和LUV特征输入预先已学习和训练好的神经网络并经神经网络处理检测出行人位置。
2.根据权利要求1所述的一种基于神经网络和双特征融合的视频中的行人检测方法,其特征在于,所述神经网络采用无隐层结构、单隐层结构或双隐层结构。
3.根据权利要求1或2所述的基于神经网络和双特征融合的视频行人检测方法,其特征在于,在所述步骤S3中,为HOG特征提取提供的图像为将前景运动图像进行归一化到64像素*128像素大小。
4.根据权利要求1所述的基于神经网络和双特征融合的视频行人检测方法,其特征在于,对二值化的前景运动对象图像进行膨胀腐蚀运算。其步骤如下:
对二值化的前景运动对象图像进行一次膨胀运算;
将经第一次膨胀运算处理的图像进行多次腐蚀运算;
再将经腐蚀运算处理的图像进行多次膨胀运算。
5.根据权利要求3所述的基于神经网络和双特征融合的视频行人检测方法,其特征在于,在所述步骤S4中,还包括将提取HOG特征及LUV特征后进行PCA降维处理。降维处理后提取HOG特征及LUV特征中最主要的一半维度。
6.根据权利要求2所述的基于神经网络和双特征融合的视频行人检测方法,其特征在于所述神经网络为采用单隐层结构的BP神经网络,采用优化为3780维的特征向量的输入结构、节点个数为80个的可提高检测精度的隐层结构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610899106.9A CN106485226A (zh) | 2016-10-14 | 2016-10-14 | 一种基于神经网络的视频行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610899106.9A CN106485226A (zh) | 2016-10-14 | 2016-10-14 | 一种基于神经网络的视频行人检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106485226A true CN106485226A (zh) | 2017-03-08 |
Family
ID=58270910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610899106.9A Pending CN106485226A (zh) | 2016-10-14 | 2016-10-14 | 一种基于神经网络的视频行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106485226A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107481270A (zh) * | 2017-08-10 | 2017-12-15 | 上海体育学院 | 乒乓球目标跟踪和轨迹预测方法、装置、存储介质和计算机设备 |
CN110099302A (zh) * | 2019-04-29 | 2019-08-06 | 北京达佳互联信息技术有限公司 | 视频分级方法、装置、设备及存储介质 |
CN111507906A (zh) * | 2019-01-31 | 2020-08-07 | 斯特拉德视觉公司 | 用用于容错及波动鲁棒性的神经网络除抖动的方法及装置 |
CN112752110A (zh) * | 2020-08-14 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 视频呈现方法及装置、计算设备、存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609716A (zh) * | 2012-01-10 | 2012-07-25 | 银江股份有限公司 | 一种基于改进的hog特征和pca的行人检测方法 |
CN103310194A (zh) * | 2013-06-07 | 2013-09-18 | 太原理工大学 | 视频中基于头顶像素点梯度方向的行人头肩部检测方法 |
CN103530607A (zh) * | 2013-09-30 | 2014-01-22 | 智慧城市系统服务(中国)有限公司 | 一种人手检测与识别的方法与装置 |
CN104091157A (zh) * | 2014-07-09 | 2014-10-08 | 河海大学 | 一种基于特征融合的行人检测方法 |
CN104112122A (zh) * | 2014-07-07 | 2014-10-22 | 叶茂 | 基于交通视频的车标自动识别方法 |
CN104537688A (zh) * | 2014-12-24 | 2015-04-22 | 南京邮电大学 | 一种基于背景差分和hog特征的运动目标检测方法 |
CN105138987A (zh) * | 2015-08-26 | 2015-12-09 | 电子科技大学 | 一种基于聚合通道特征和运动估计的车辆检测方法 |
CN105184779A (zh) * | 2015-08-26 | 2015-12-23 | 电子科技大学 | 一种基于快速特征金字塔的车辆多尺度跟踪方法 |
CN105678231A (zh) * | 2015-12-30 | 2016-06-15 | 中通服公众信息产业股份有限公司 | 一种基于稀疏编码和神经网络的行人图片检测方法 |
CN105913026A (zh) * | 2016-04-12 | 2016-08-31 | 江苏大学 | 一种基于Haar-PCA特征和概率神经网络的行人检测方法 |
-
2016
- 2016-10-14 CN CN201610899106.9A patent/CN106485226A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609716A (zh) * | 2012-01-10 | 2012-07-25 | 银江股份有限公司 | 一种基于改进的hog特征和pca的行人检测方法 |
CN103310194A (zh) * | 2013-06-07 | 2013-09-18 | 太原理工大学 | 视频中基于头顶像素点梯度方向的行人头肩部检测方法 |
CN103530607A (zh) * | 2013-09-30 | 2014-01-22 | 智慧城市系统服务(中国)有限公司 | 一种人手检测与识别的方法与装置 |
CN104112122A (zh) * | 2014-07-07 | 2014-10-22 | 叶茂 | 基于交通视频的车标自动识别方法 |
CN104091157A (zh) * | 2014-07-09 | 2014-10-08 | 河海大学 | 一种基于特征融合的行人检测方法 |
CN104537688A (zh) * | 2014-12-24 | 2015-04-22 | 南京邮电大学 | 一种基于背景差分和hog特征的运动目标检测方法 |
CN105138987A (zh) * | 2015-08-26 | 2015-12-09 | 电子科技大学 | 一种基于聚合通道特征和运动估计的车辆检测方法 |
CN105184779A (zh) * | 2015-08-26 | 2015-12-23 | 电子科技大学 | 一种基于快速特征金字塔的车辆多尺度跟踪方法 |
CN105678231A (zh) * | 2015-12-30 | 2016-06-15 | 中通服公众信息产业股份有限公司 | 一种基于稀疏编码和神经网络的行人图片检测方法 |
CN105913026A (zh) * | 2016-04-12 | 2016-08-31 | 江苏大学 | 一种基于Haar-PCA特征和概率神经网络的行人检测方法 |
Non-Patent Citations (6)
Title |
---|
GANGQIANG SHI 等: "The Video People Detection Based on Neural Network", 《PROCEEDINGS OF ICCT2015》 * |
REN-WU SUN 等: "Pedestrian Detection by PCA-Based Mixed HOG-LBP Features", 《ICIMCS"12》 * |
周钦强: "基于人工智能技术Naive Bayes文本自动分类系统研究", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑(月刊)》 * |
孙锐 等: "基于特征融合和交叉核SVM的快速行人检测方法", 《光电工程》 * |
曲永宇 等: "基于HOG和颜色特征的行人检测", 《武汉理工大学学报》 * |
沈贺丹: "核心能力评价系统的分类模块研究", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑(月刊)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107481270A (zh) * | 2017-08-10 | 2017-12-15 | 上海体育学院 | 乒乓球目标跟踪和轨迹预测方法、装置、存储介质和计算机设备 |
CN107481270B (zh) * | 2017-08-10 | 2020-05-19 | 上海体育学院 | 乒乓球目标跟踪和轨迹预测方法、装置、存储介质和计算机设备 |
CN111507906A (zh) * | 2019-01-31 | 2020-08-07 | 斯特拉德视觉公司 | 用用于容错及波动鲁棒性的神经网络除抖动的方法及装置 |
CN111507906B (zh) * | 2019-01-31 | 2023-10-10 | 斯特拉德视觉公司 | 用用于容错及波动鲁棒性的神经网络除抖动的方法及装置 |
CN110099302A (zh) * | 2019-04-29 | 2019-08-06 | 北京达佳互联信息技术有限公司 | 视频分级方法、装置、设备及存储介质 |
US11288516B2 (en) | 2019-04-29 | 2022-03-29 | Beijing Dajia Internet Information Technology Co., Ltd. | Video rating method, video rating device, equipment and storage medium |
CN112752110A (zh) * | 2020-08-14 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 视频呈现方法及装置、计算设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446617B (zh) | 抗侧脸干扰的人脸快速检测方法 | |
WO2021208275A1 (zh) | 一种交通视频背景建模方法及系统 | |
CN105069472B (zh) | 一种基于卷积神经网络自适应的车辆检测方法 | |
CN109154978B (zh) | 用于检测植物疾病的系统和方法 | |
US20230289979A1 (en) | A method for video moving object detection based on relative statistical characteristics of image pixels | |
CN106682635B (zh) | 一种基于随机森林特征选择的烟雾检测方法 | |
CN104834898B (zh) | 一种人物摄影图像的质量分类方法 | |
CN107491762B (zh) | 一种行人检测方法 | |
Zhang et al. | Lighting and pose robust face sketch synthesis | |
CN111898406B (zh) | 基于焦点损失和多任务级联的人脸检测方法 | |
CN108647625A (zh) | 一种表情识别方法及装置 | |
CN107564022A (zh) | 基于贝叶斯融合的视频显著性检测方法 | |
CN106485226A (zh) | 一种基于神经网络的视频行人检测方法 | |
CN106296744A (zh) | 一种结合自适应模型和多阴影属性的运动目标检测方法 | |
CN113762009B (zh) | 一种基于多尺度特征融合及双注意力机制的人群计数方法 | |
CN111046827A (zh) | 一种基于卷积神经网络的视频烟雾检测方法 | |
CN106991686A (zh) | 一种基于超像素光流场的水平集轮廓跟踪方法 | |
Bak et al. | Two-stream convolutional networks for dynamic saliency prediction | |
CN109190456A (zh) | 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法 | |
CN111507416B (zh) | 一种基于深度学习的吸烟行为实时检测方法 | |
CN112232180A (zh) | 一种夜晚水下鱼类目标检测方法 | |
CN105184771A (zh) | 一种自适应运动目标检测系统及检测方法 | |
CN108734200A (zh) | 基于bing特征的人体目标视觉检测方法和装置 | |
CN108960142A (zh) | 基于全局特征损失函数的行人再识别方法 | |
CN108765463A (zh) | 一种结合区域提取与改进纹理特征的运动目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170308 |