CN109359577A - 一种基于机器学习的复杂背景下人数检测系统 - Google Patents

一种基于机器学习的复杂背景下人数检测系统 Download PDF

Info

Publication number
CN109359577A
CN109359577A CN201811170091.8A CN201811170091A CN109359577A CN 109359577 A CN109359577 A CN 109359577A CN 201811170091 A CN201811170091 A CN 201811170091A CN 109359577 A CN109359577 A CN 109359577A
Authority
CN
China
Prior art keywords
image
gradient
frame
channel
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811170091.8A
Other languages
English (en)
Other versions
CN109359577B (zh
Inventor
魏榕山
欧阳魁
杨培祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201811170091.8A priority Critical patent/CN109359577B/zh
Publication of CN109359577A publication Critical patent/CN109359577A/zh
Application granted granted Critical
Publication of CN109359577B publication Critical patent/CN109359577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于机器学习的复杂背景下人数检测系统。可在复杂背景下通过视频监控检测人数,提出了一种搭载红外摄像头的基于机器学习的人数检测系统,增强了夜间及弱环境光、低照明度下的人数检测能力,采用基于头肩的聚合通道特征(ACF)算法和Adaboost算法相结合的方法,可以提高在面部存在遮挡、光照不均匀、存在噪声等复杂背景下实时检测人数的正确率和速度,并且可以检测多角度的人体,正面、背面、侧面均可检测。

Description

一种基于机器学习的复杂背景下人数检测系统
技术领域
本发明涉及一种基于机器学习的复杂背景下人数检测系统。
背景技术
目前,在视频中监测人数的主要方法有:使用sobel和canny等算子边缘检测人脸的结构特征、检测基于面部不变的特征(如眼睛、眉毛)、使用匹配算法来检测视频中人脸是否存在与模板相匹配的部分、使用经过训练的分类器来检测人脸。
使用sobel和canny算子检测人脸的结构特征方法简单,检测速度较快,但是在复杂背景下精度较差,容易出现较大的误检。由于复杂背景下存在面部遮挡,光照不均匀等情况,检测面部不变特征的方法很容易受到其影响,精度较差。由于人种、肤色、胖瘦等因素,使用匹配算法需要采集大量的样本,才可以得到一个稳定的人脸模板,匹配过程中计算量太大,不适合用于存在多人的实时视频监控。使用经过训练的分类器是目前常用且效果较好的方法。主要的方法有提取每帧图片的方向梯度直方图(HOG)特征和支持向量机(SVM)相结合的方法。但是这种方法容易受到噪声的干扰,而且一旦人脸被遮挡,检测精度就会大大下降。由于在实际应用中,人脸不会总是面对摄像头,所以需要检测多角度的人脸,甚至需要检测人体背面,以上几种方法在此方面表现不佳。
发明内容
本发明的目的在于提供一种基于机器学习的复杂背景下人数检测系统,可在复杂背景下通过视频监控检测人数,提出了一种搭载红外摄像头的基于机器学习的人数检测系统,增强了夜间及弱环境光、低照明度下的人数检测能力,采用基于头肩的聚合通道特征(ACF)算法和Adaboost算法相结合的方法,可以提高在面部存在遮挡、光照不均匀、存在噪声等复杂背景下实时检测人数的正确率和速度,并且可以检测多角度的人体,正面、背面、侧面均可检测。
为实现上述目的,本发明的技术方案是:一种基于机器学习的复杂背景下人数检测系统,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;
所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;
所述微处理器对输入原始图像进行处理,处理过程如下:
(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列,重复以上计算,得到所有层数的图像;
(2)使用OpenCV的split函数,将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道;
(3)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向;梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π);与(-1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(-1,0,1)T梯度算子做卷积得到垂直方向梯度Gy,梯度方向为使用2D三角滤波器进行图像的快速卷积;将梯度幅值进行归一化消除不同特征之间量纲不同带来的影响;得到梯度幅值一个特征通道;
(4)计算梯度方向直方图;将梯度方向[0,π)分为6个区间,将所有层数的图像的梯度幅值作为权重,把图像的梯度方向投影到6个区间,统计6个区间的投影数,计算梯度方向直方图,得到6个通道特征;
(5)经过(2)、(3)、(4)步骤的计算,所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征;若取得的通道尺寸和预先设定的通道尺寸不匹配,则进行降采样,计算每个通道的系数,以给定的系数进行特征图的重采样,接着调用OpenCV的convTri函数进行图像平滑,最后进行图像填充,前三个通道为颜色通道,采用复制方式进行填充,其余通道为梯度幅值通道和梯度方向直方图通道,采用0进行填充;
(6)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口,以8像素为步长,从图像的左上角开始,向右和向下滑动,将当前窗口的特征描述子送入经过头肩样本训练的增强弱分类器,分类器对特征描述子进行评分;如果当前窗口评分低于阈值,则立即停止判断,若当前窗口评分高于阈值,则记录该窗口的位置和置信度,框出人体的位置,直到滑动窗口到达图片的右下角;
(7)使用caltech行人数据集和MATLAB计算机视觉工具箱处理样本和训练模型;提取行人数据集中的头肩样本的聚合通道特征,采用Adaboost算法训练,得到基于增强决策树的头肩检测分类器;
(8)由于在不同尺度下的图片进行特征提取的滑动窗口的大小是不变的,所以需要将经过标记后的图像金字塔中每个尺度的图片放大到原始图像的大小;根据步骤(1)得到的缩放比例,使用OpenCV的resize函数,将经过标记的不同尺度的图像恢复到原始图像大小,就可以把原始图像上的所有人体都标记出来;
(9)由于采用滑动窗口检测,同一个人体可能会出现多个标记框,每个框都带有分类器的得分,每个框有可能互相重叠;因此需要去除冗余的标记框,只保留最准确的标记框;由于一帧视频里面可能存在多个人,单纯取得分最高的标记框是不可行的,因此采用非极大值抑制算法,即首先将所有的框按照分类器得分从低到高排序;选择得分最高的框,遍历其余的框,如果和得分最高的框的重叠面积与这两个框面积之间最小值的比值大于设定的阈值,则删除该框;接着从剩下还未处理的框中选取得分最高的框继续以上处理,直到不存在重叠的标记框;
(10)统计标记框的个数,即为检测到的人数;并在每个框旁显示置信度。
在本发明一实施例中,还包括一WIFI模块,用于将微处理器处理后的每一帧图像通过无线发送至监控室接收端,实现实时监控人数。
在本发明一实施例中,所述步骤(3)中,使用2D三角滤波器进行图像的快速卷积,其半径取值为5。
在本发明一实施例中,所述步骤(3)中,将梯度幅值进行归一化的归一化系数为0.005。
相较于现有技术,本发明具有以下有益效果:本发明基于机器学习的复杂背景下人数检测系统具有较好的检测正确率和检测速度。搭载的红外摄像头使得检测系统在夜间及弱环境光、低照明度下仍可以进行视频监控。微处理器搭载基于头肩的聚合通道特征(ACF)算法和Adaboost算法的ACF检测器,通过对每个像素采集10个聚合通道特征送入分类器分类,可以提高面部存在遮挡、光照不均匀、存在噪声等复杂背景下的人数检测正确率和检测速度,并且可以检测多角度的人体,正面、背面、侧面均可识别。WIFI模块将经过人数标记的视频实时发送到监控端。所以本发明提出的系统可以24小时,多角度实时检测人数。
附图说明
图1为本发明人数检测系统框图。
图2为本发明算法工作流程图。
图3为本发明人数检测系统工作流程图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明提供了一种基于机器学习的复杂背景下人数检测系统,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;
所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;
所述微处理器对输入原始图像进行处理,处理过程如下:
(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列,重复以上计算,得到所有层数的图像;
(2)使用OpenCV的split函数,将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道;
(3)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向;梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π);与(-1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(-1,0,1)T梯度算子做卷积得到垂直方向梯度Gy,梯度方向为使用2D三角滤波器进行图像的快速卷积;将梯度幅值进行归一化消除不同特征之间量纲不同带来的影响;得到梯度幅值一个特征通道;
(4)计算梯度方向直方图;将梯度方向[0,π)分为6个区间,将所有层数的图像的梯度幅值作为权重,把图像的梯度方向投影到6个区间,统计6个区间的投影数,计算梯度方向直方图,得到6个通道特征;
(5)经过(2)、(3)、(4)步骤的计算,所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征;若取得的通道尺寸和预先设定的通道尺寸不匹配,则进行降采样,计算每个通道的系数,以给定的系数进行特征图的重采样,接着调用OpenCV的convTri函数进行图像平滑,最后进行图像填充,前三个通道为颜色通道,采用复制方式进行填充,其余通道为梯度幅值通道和梯度方向直方图通道,采用0进行填充;
(6)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口,以8像素为步长,从图像的左上角开始,向右和向下滑动,将当前窗口的特征描述子送入经过头肩样本训练的增强弱分类器,分类器对特征描述子进行评分;如果当前窗口评分低于阈值,则立即停止判断,若当前窗口评分高于阈值,则记录该窗口的位置和置信度,框出人体的位置,直到滑动窗口到达图片的右下角;
(7)使用caltech行人数据集和MATLAB计算机视觉工具箱处理样本和训练模型;提取行人数据集中的头肩样本的聚合通道特征,采用Adaboost算法训练,得到基于增强决策树的头肩检测分类器;
(8)由于在不同尺度下的图片进行特征提取的滑动窗口的大小是不变的,所以需要将经过标记后的图像金字塔中每个尺度的图片放大到原始图像的大小;根据步骤(1)得到的缩放比例,使用OpenCV的resize函数,将经过标记的不同尺度的图像恢复到原始图像大小,就可以把原始图像上的所有人体都标记出来;
(9)由于采用滑动窗口检测,同一个人体可能会出现多个标记框,每个框都带有分类器的得分,每个框有可能互相重叠;因此需要去除冗余的标记框,只保留最准确的标记框;由于一帧视频里面可能存在多个人,单纯取得分最高的标记框是不可行的,因此采用非极大值抑制算法,即首先将所有的框按照分类器得分从低到高排序;选择得分最高的框,遍历其余的框,如果和得分最高的框的重叠面积与这两个框面积之间最小值的比值大于设定的阈值,则删除该框;接着从剩下还未处理的框中选取得分最高的框继续以上处理,直到不存在重叠的标记框;
(10)统计标记框的个数,即为检测到的人数;并在每个框旁显示置信度。
还包括一WIFI模块,用于将微处理器处理后的每一帧图像通过无线发送至监控室接收端,实现实时监控人数。
所述步骤(3)中,使用2D三角滤波器进行图像的快速卷积,其半径取值为5。所述步骤(3)中,将梯度幅值进行归一化的归一化系数为0.005。
以下为本发明的具体实现过程。
本发明提出的基于机器学习的复杂背景下人数检测系统采用红外摄像头进行实时图像采集。微处理器搭载基于头肩的聚合通道特征(ACF)算法和Adaboost算法的ACF检测器,实时处理采集的图像,采用基于头肩的聚合通道特征(ACF)算法进行聚合通道特征提取,将特征描述子送入Adaboost强分类器分类,判断是否存在人,并将人肩部以上标记出来,给出检测置信度以及检测人数。WIFI模块将实时监控视频和检测结果发送到监控室。人数检测系统的框图如图1所示。
本发明系统由三个部分构成,分别为红外摄像头、搭载基于头肩的聚合通道特征(ACF)算法和Adaboost算法的ACF检测器的微处理器、WIFI模块。
基于机器学习的复杂背景下人数检测系统各模块功能如下所述:
1、红外摄像头
红外摄像头可以提高在弱环境光下的检测能力。微处理器的搭载的算法对环境光线要求不高,只需要采集的图像人眼可辨认即可。算法对拍摄角度要求不高,只需要拍摄到人的正面或侧面或背面,所以摄像头可安装在墙体侧面高处。
2、微处理器
微处理器与摄像头相连,实时处理摄像头采集的图像。微处理器进行实时处理的算法工作流程图如图2所示,具体过程如下所述:
1)打开摄像头,捕捉摄像头生成的视频流,将每一帧图像送入ACF检测器判断是否存在人。
2)ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数。生成每个尺度的缩放比例,对原始图片进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列。重复以上计算,即可得到所有层数的图像。
3)使用OpenCV的split函数,将所有层数的BGR像素格式拆分为R通道,G通道,B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道。
4)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向。梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π)。与(-1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(-1,0,1)T梯度算子做卷积得到垂直方向梯度Gy,梯度方向为使用2D三角滤波器进行图像的快速卷积,取半径为5。将梯度幅值进行归一化,归一化系数为0.005,消除不同特征之间量纲不同带来的影响。得到梯度幅值一个特征通道。
5)计算梯度方向直方图。将梯度方向[0,π)分为6个区间,将所有层数的图像的梯度幅值作为权重,把图像的梯度方向投影到6个区间,统计6个区间的投影数,计算梯度方向直方图,得到6个通道特征。
6)经过3)、4)、5)步骤的计算,所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征。若取得的通道尺寸和预先设定的通道尺寸不匹配,则进行降采样,计算每个通道的系数,以给定的系数进行特征图的重采样,接着调用OpenCV的convTri函数进行图像平滑,最后进行图像填充,前三个通道为颜色通道,采用复制方式进行填充,其余通道为梯度幅值通道和梯度方向直方图通道,采用0进行填充。
7)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口,以8像素为步长,从图像的左上角开始,向右和向下滑动,将当前窗口的特征描述子送入经过头肩样本训练的增强弱分类器,分类器对特征描述子进行评分。如果评分低于阈值,则立即停止判断,若该窗口评分高于阈值,则记录该窗口的位置和置信度,框出人体的位置,直到滑动窗口到达图片的右下角。
8)使用caltech行人数据集和MATLAB计算机视觉工具箱(Piotr's ComputerVision Matlab Toolbox)处理样本和训练模型。提取行人数据集中的头肩样本的聚合通道特征,采用Adaboost算法训练,得到基于增强决策树的头肩检测分类器。由于训练样本采用的是头肩样本,所以分类器可以检测出人的正面、侧面和背面。
9)由于在不同尺度下的图片进行特征提取的滑动窗口的大小是不变的,所以需要将经过标记后的图像金字塔中每个尺度的图片放大到原始图像的大小。根据步骤2得到的缩放比例,使用OpenCV的resize函数,将经过标记的不同尺度的图像恢复到原始图像大小,就可以把原始图像上的所有人体都标记出来。
10)由于采用滑动窗口检测,同一个人体可能会出现多个标记框,每个框都带有分类器的得分,每个框有可能互相重叠。我们需要去除冗余的标记框,只保留最准确的标记框。由于一帧视频里面可能存在多个人,单纯取得分最高的标记框是不可行的,采用非极大值抑制算法可以较好地解决此问题。首先将所有的框按照分类器得分从低到高排序。选择得分最高的框,遍历其余的框,如果和得分最高的框的重叠面积与这两个框面积之间最小值的比值大于设定的阈值,则删除该框。接着从剩下还未处理的框中选取得分最高的框继续以上处理,直到不存在重叠的标记框。
11)统计标记框的个数,即为检测到的人数。并在每个框旁显示置信度。
3、WIFI模块
WIFI模块将实时处理的每一帧视频画面通过无线网络发送到监控室接收端,实现实时监控人数。
本发明人数检测系统工作流程图如图3所示,工作流程如下所述:
(1)微处理器打开摄像头,红外摄像头录制视频。
(2)微处理器捕捉摄像头生成的视频流,将每一帧图像送入ACF检测器。
(3)ACF检测器计算图像特征金字塔,生成每个尺度的图像。
(4)将RGB颜色空间的图像转换到LUV颜色空间,得到3个特征通道。
(5)计算图像的梯度幅值以及6个方向的梯度方向直方图,得到7个特征通道。
(6)对所有尺度的图像进行滑动窗口检测。
(7)将滑动窗口的特征描述子送入经过头肩样本训练的分类器判断是否存在人。
(8)将每个尺度的图像进行缩放,使用非极大值抑制去除冗余重叠的标记框。
(9)统计标记框的个数。
(10)WIFI模块将经过标记的视频发送到监控端。
本发明可以在复杂背景下实时检测人数,提高了面部存在遮挡、光照不均匀、图像存在噪声、人未正对摄像头(侧对或背对)下的检测正确率和检测速度。搭载红外摄像头增强了在弱光环境下的检测能力。实现了可以全天实时检测复杂背景下多角度人体的人数检测系统。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (4)

1.一种基于机器学习的复杂背景下人数检测系统,其特征在于,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;
所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;
所述微处理器对输入原始图像进行处理,处理过程如下:
(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列,重复以上计算,得到所有层数的图像;
(2)使用OpenCV的split函数,将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道;
(3)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向;梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π);与(-1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(-1,0,1)T梯度算子做卷积得到垂直方向梯度Gy,梯度方向为使用2D三角滤波器进行图像的快速卷积;将梯度幅值进行归一化消除不同特征之间量纲不同带来的影响;得到梯度幅值一个特征通道;
(4)计算梯度方向直方图;将梯度方向[0,π)分为6个区间,将所有层数的图像的梯度幅值作为权重,把图像的梯度方向投影到6个区间,统计6个区间的投影数,计算梯度方向直方图,得到6个通道特征;
(5)经过(2)、(3)、(4)步骤的计算,所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征;若取得的通道尺寸和预先设定的通道尺寸不匹配,则进行降采样,计算每个通道的系数,以给定的系数进行特征图的重采样,接着调用OpenCV的convTri函数进行图像平滑,最后进行图像填充,前三个通道为颜色通道,采用复制方式进行填充,其余通道为梯度幅值通道和梯度方向直方图通道,采用0进行填充;
(6)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口,以8像素为步长,从图像的左上角开始,向右和向下滑动,将当前窗口的特征描述子送入经过头肩样本训练的增强弱分类器,分类器对特征描述子进行评分;如果当前窗口评分低于阈值,则立即停止判断,若当前窗口评分高于阈值,则记录该窗口的位置和置信度,框出人体的位置,直到滑动窗口到达图片的右下角;
(7)使用caltech行人数据集和MATLAB计算机视觉工具箱处理样本和训练模型;提取行人数据集中的头肩样本的聚合通道特征,采用Adaboost算法训练,得到基于增强决策树的头肩检测分类器;
(8)由于在不同尺度下的图片进行特征提取的滑动窗口的大小是不变的,所以需要将经过标记后的图像金字塔中每个尺度的图片放大到原始图像的大小;根据步骤(1)得到的缩放比例,使用OpenCV的resize函数,将经过标记的不同尺度的图像恢复到原始图像大小,就可以把原始图像上的所有人体都标记出来;
(9)由于采用滑动窗口检测,同一个人体可能会出现多个标记框,每个框都带有分类器的得分,每个框有可能互相重叠;因此需要去除冗余的标记框,只保留最准确的标记框;由于一帧视频里面可能存在多个人,单纯取得分最高的标记框是不可行的,因此采用非极大值抑制算法,即首先将所有的框按照分类器得分从低到高排序;选择得分最高的框,遍历其余的框,如果和得分最高的框的重叠面积与这两个框面积之间最小值的比值大于设定的阈值,则删除该框;接着从剩下还未处理的框中选取得分最高的框继续以上处理,直到不存在重叠的标记框;
(10)统计标记框的个数,即为检测到的人数;并在每个框旁显示置信度。
2.根据权利要求1所述的一种基于机器学习的复杂背景下人数检测系统,其特征在于,还包括一WIFI模块,用于将微处理器处理后的每一帧图像通过无线发送至监控室接收端,实现实时监控人数。
3.根据权利要求1所述的一种基于机器学习的复杂背景下人数检测系统,其特征在于,所述步骤(3)中,使用2D三角滤波器进行图像的快速卷积,其半径取值为5。
4.根据权利要求1所述的一种基于机器学习的复杂背景下人数检测系统,其特征在于,所述步骤(3)中,将梯度幅值进行归一化的归一化系数为0.005。
CN201811170091.8A 2018-10-08 2018-10-08 一种基于机器学习的复杂背景下人数检测系统 Active CN109359577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811170091.8A CN109359577B (zh) 2018-10-08 2018-10-08 一种基于机器学习的复杂背景下人数检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811170091.8A CN109359577B (zh) 2018-10-08 2018-10-08 一种基于机器学习的复杂背景下人数检测系统

Publications (2)

Publication Number Publication Date
CN109359577A true CN109359577A (zh) 2019-02-19
CN109359577B CN109359577B (zh) 2021-06-29

Family

ID=65348544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811170091.8A Active CN109359577B (zh) 2018-10-08 2018-10-08 一种基于机器学习的复杂背景下人数检测系统

Country Status (1)

Country Link
CN (1) CN109359577B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977862A (zh) * 2019-03-26 2019-07-05 北京茵沃汽车科技有限公司 一种车位限位器的识别方法
CN110793529A (zh) * 2019-12-18 2020-02-14 福州大学 一种快速匹配星图识别方法
CN110794405A (zh) * 2019-10-18 2020-02-14 北京全路通信信号研究设计院集团有限公司 一种基于相机和雷达融合的目标检测方法及系统
CN112419263A (zh) * 2020-11-20 2021-02-26 上海电力大学 一种基于类间覆盖比的多类别非极大抑制方法及系统
CN113219450A (zh) * 2021-04-29 2021-08-06 深圳市恒天伟焱科技股份有限公司 测距定位方法、测距装置及可读存储介质
CN117152826A (zh) * 2023-11-01 2023-12-01 武汉中科通达高新技术股份有限公司 基于目标跟踪和异常检测的实时跨镜追踪方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法
CN105303193A (zh) * 2015-09-21 2016-02-03 重庆邮电大学 一种基于单帧图像处理的人数统计系统
CN105809114A (zh) * 2016-02-29 2016-07-27 深圳市智美达科技股份有限公司 人脸检测方法及装置
CN106529448A (zh) * 2016-10-27 2017-03-22 四川长虹电器股份有限公司 利用聚合通道特征进行多视角人脸检测的方法
CN107330390A (zh) * 2017-06-26 2017-11-07 上海远洲核信软件科技股份有限公司 一种基于图像分析和深度学习的人数统计方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886308A (zh) * 2014-04-15 2014-06-25 中南大学 一种使用聚合通道特征和软级联分类器的行人检测方法
CN105303193A (zh) * 2015-09-21 2016-02-03 重庆邮电大学 一种基于单帧图像处理的人数统计系统
CN105809114A (zh) * 2016-02-29 2016-07-27 深圳市智美达科技股份有限公司 人脸检测方法及装置
CN106529448A (zh) * 2016-10-27 2017-03-22 四川长虹电器股份有限公司 利用聚合通道特征进行多视角人脸检测的方法
CN107330390A (zh) * 2017-06-26 2017-11-07 上海远洲核信软件科技股份有限公司 一种基于图像分析和深度学习的人数统计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHAO QIU ET AL: "Statistics of the Number of People Based on the Surveillance Video", 《PAAP 2017》 *
叶锋 等: "基于Adaboost与背景差分级联的室内人数统计方法", 《福建师范大学学报(自然科学版)》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977862A (zh) * 2019-03-26 2019-07-05 北京茵沃汽车科技有限公司 一种车位限位器的识别方法
CN109977862B (zh) * 2019-03-26 2021-10-15 北京茵沃汽车科技有限公司 一种车位限位器的识别方法
CN110794405A (zh) * 2019-10-18 2020-02-14 北京全路通信信号研究设计院集团有限公司 一种基于相机和雷达融合的目标检测方法及系统
CN110794405B (zh) * 2019-10-18 2022-06-10 北京全路通信信号研究设计院集团有限公司 一种基于相机和雷达融合的目标检测方法及系统
CN110793529A (zh) * 2019-12-18 2020-02-14 福州大学 一种快速匹配星图识别方法
CN110793529B (zh) * 2019-12-18 2022-06-03 福州大学 一种快速匹配星图识别方法
CN112419263A (zh) * 2020-11-20 2021-02-26 上海电力大学 一种基于类间覆盖比的多类别非极大抑制方法及系统
CN113219450A (zh) * 2021-04-29 2021-08-06 深圳市恒天伟焱科技股份有限公司 测距定位方法、测距装置及可读存储介质
CN113219450B (zh) * 2021-04-29 2024-04-19 深圳市恒天伟焱科技股份有限公司 测距定位方法、测距装置及可读存储介质
CN117152826A (zh) * 2023-11-01 2023-12-01 武汉中科通达高新技术股份有限公司 基于目标跟踪和异常检测的实时跨镜追踪方法
CN117152826B (zh) * 2023-11-01 2024-03-22 武汉中科通达高新技术股份有限公司 基于目标跟踪和异常检测的实时跨镜追踪方法

Also Published As

Publication number Publication date
CN109359577B (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
CN109359577A (zh) 一种基于机器学习的复杂背景下人数检测系统
CN108009531B (zh) 一种多策略防欺诈的人脸识别方法
CN104123543B (zh) 一种基于人脸识别的眼球运动识别方法
CN104143086B (zh) 人像比对在移动终端操作系统上的应用方法
CN109918971B (zh) 监控视频中人数检测方法及装置
CN109840565A (zh) 一种基于眼部轮廓特征点纵横比的眨眼检测方法
KR20170006355A (ko) 모션벡터 및 특징벡터 기반 위조 얼굴 검출 방법 및 장치
CN107798279B (zh) 一种人脸活体检测方法及装置
CN101739546A (zh) 基于图像交叉重建的单样本注册图像人脸识别方法
CN102214309B (zh) 一种基于头肩模型的特定人体识别方法
CN101615292B (zh) 基于灰度信息的人眼精确定位方法
CN106886216A (zh) 基于rgbd人脸检测的机器人自动跟踪方法和系统
CN108985170A (zh) 基于三帧差分法及深度学习的输电线路悬挂物识别方法
CN105205437B (zh) 基于头部轮廓验证的侧脸检测方法及装置
CN106203237A (zh) 集装箱拖车编号的识别方法和装置
CN105844242A (zh) 图像中的肤色检测方法
JP6351243B2 (ja) 画像処理装置、画像処理方法
CN107480586B (zh) 基于人脸特征点位移的生物识别照片仿冒攻击检测方法
CN102184016B (zh) 基于视频序列识别的无接触式鼠标控制方法
CN104317385A (zh) 一种手势识别方法和系统
CN106650606A (zh) 人脸图像的匹配及处理方法、人脸图像模型构建系统
CN104361357B (zh) 基于图片内容分析的相片集分类系统及分类方法
CN106548131A (zh) 一种基于行人检测的施工人员安全帽实时检测方法
CN105930798A (zh) 基于学习的面向手机应用的舌像快速检测分割方法
CN107330370A (zh) 一种额头皱纹动作检测方法和装置及活体识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant