CN107316320A - 一种使用gpu加速的实时行人检测系统 - Google Patents

一种使用gpu加速的实时行人检测系统 Download PDF

Info

Publication number
CN107316320A
CN107316320A CN201710463293.0A CN201710463293A CN107316320A CN 107316320 A CN107316320 A CN 107316320A CN 201710463293 A CN201710463293 A CN 201710463293A CN 107316320 A CN107316320 A CN 107316320A
Authority
CN
China
Prior art keywords
mrow
mtd
msub
munderover
gpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710463293.0A
Other languages
English (en)
Inventor
黄亮
王旭
王欣欣
叶超
应艳丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Hongdu Aviation Industry Group Co Ltd
Original Assignee
Jiangxi Hongdu Aviation Industry Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Hongdu Aviation Industry Group Co Ltd filed Critical Jiangxi Hongdu Aviation Industry Group Co Ltd
Priority to CN201710463293.0A priority Critical patent/CN107316320A/zh
Publication of CN107316320A publication Critical patent/CN107316320A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种使用GPU加速的实时行人检测系统,包括GPU设备,采用开源工具ffmpeg将接入的视频流进行解码,此时格式为RGB的视频存数据位于内存中,在采用多核混序拷贝将内存中的数据传输至GPU设备内存中,而后将位于GPU设备内存中的待识别图像数据进行多尺度缩放,最后对每一个尺度的待识别图像加载GPU加速检测算法,进行实时行人检测;能够快速、准确对视频中出现的人进行检测,有效降低防卫人员的工作量。

Description

一种使用GPU加速的实时行人检测系统
技术领域
本发明涉及人工智能技术领域,尤其涉及一种使用GPU加速的实时行人检测系统。
背景技术
针对视频的行人检测有着广泛的应用场景,如:安防监控、机场安全、自动驾驶、辅助驾驶等等,故行人检测是计算机视觉和模式识别领域中的重要研究方向;不同行人的身材、姿势、视角、衣着、光照方面都有着极大的变化,再加上复杂的背景以及摄像头的晃动,都成为行人检测需要解决的问题。一个良好的行人检测系统需要满足两个属性,首先是准确性,其次是实时性,为满足系统的准确性,需要设计一个或若干个能够表征行人特征的描述符,通常这些描述符越复杂,系统的准确性会有一定程度的提高,但同时计算的复杂度也会随之提高;此外,针对一些特定的应用,如实时视频安防、自动驾驶,系统则必须满足实时性,因此实现一个既能准确检测出行人,又能满足实时性的行人检测系统有客观需求。
发明内容
本发明所解决的技术问题在于提供一种使用GPU加速的实时行人检测系统,以解决上述背景技术中的缺点。
本发明所解决的技术问题采用以下技术方案来实现:
一种使用GPU加速的实时行人检测系统,包括GPU设备,采用开源工具ffmpeg将接入的视频流进行解码,此时格式为RGB的视频存数据位于内存中,在采用多核混序拷贝将内存中的数据传输至GPU设备内存中,而后将位于GPU设备内存中的待识别图像数据进行多尺度缩放,最后对每一个尺度的待识别图像加载GPU加速检测算法,进行实时行人检测,具体步骤如下:
1)训练行人检测模型
①数据集
使用INRIA数据集,INRIA数据集中用来训练的正样本有2416张,正样本的宽高分辨率有三个版本64x128、70x134、96x160,可供选择;而1218张分辨率不同的负样本只有一个版本,选择宽高分辨率为64x128的紧凑型(周围背景较少)正样本,为了使CENTRIST特征更好的描述行人,将宽高分辨率为64x128的正样本裁剪为宽高分辨率为36x108的紧凑缩版正样本;
②建立分类器
在训练阶段,使用所有的正样本形成规模为2416的训练集P和规模为1218的负样本N1(在每一个负样本中随机选取位置截取10个36x108的矩形框形成),令NT←N1使用P∪NT训练得到一个线性SVM分类器H1;使用SVM分类器H1检测所有的负样本N1,将误识别为正样本的负样本称为难例,记为Nhard,令NT←NT∪Nhard(这一过程称之为Bootstrap流程),并重复识别难例这个流程,直到难例的数量为0,最终得到的线性SVM分类器记为HLIN;对于非线性HIK-SVM,同样使用上述Bootstrap流程方法训练,最终得到非线性SVM分类器记为HHIK
2)GPU加速检测算法
采用中心变换直方图特征结合CT变换对训练行人检测模型的样本图片进行检测,通过比较像素点与其周围像素灰度值的大小计算,计算方法如下:
使用高宽分辨率为36x108的检测窗口,将训练行人检测模型中的每个样本图片划分9x4个块(每个块的尺寸为12x9)与邻近的2x2个块组成一个超级块,并提取每一个超级块的中心变换直方图特征,每一个检测窗口合计有8x3=24个超级块,故每一检测窗口将形成256x24=6144维的特征向量(CT变换后变量取值范围是[0~255],每一个超级块形成一个1x256的中心变换直方图);在计算中心变换直方图特征时,每一个超级块边界不需要考虑,因为CT变换需要3x3的区域;
将采集的训练行人检测模型样本图片进行灰度化处理得灰度图,在灰度图的基础上进行sobel变换;
待sobel变换后,继而进行CT变换得CT变换图,在CT变换图上加载GPU加速检测算法;
假设一个w∈R6144的线性SVM分类器,并将其按照从左到右,自上而下的顺序将w分割24个wi,j∈R256,i≤i≤8,1≤j≤3对应于每一个超级块,给定一个训练行人检测模型中的样本图片,宽高分辨率为108x36,根据下式的正负判断是否包含行人:
(h,w)表达一个检测窗口,(hs,ws)=(h/9,w/4)表示一个块,则一个超级块为(2hs,2ws),给定一张训练行人检测模型中的样本图片I,S表示其sobel边缘图,S的CT变换图用C表示,对于左上角坐标为(t,l)的检测窗口,式(1)可以改写为:
其中,是wi,j第k个元素,C(x,y)是CT变换图C的一个像素点的值,x为2~2hs-1,以移除超级块的边界;
接下来创建多张辅助图Ai,j,1≤i≤8,1≤j≤3,辅助图的尺寸与训练行人检测模型中的样本图片I相同,设辅助图Ai,j位于(x,y)处的像素值为:
于是式(2)可写为:
使用积分图技巧,式(4)中括号的部分仅需3次算术操作,因此式(4)的计算复杂度为0(1);
使用一张辅助图计算式(4),从而不需要显式地计算出每一个位置对应的特征f,具体方法如下,定义唯一一个辅助图A,
其中,nx=8,ny=3.故wTf可以写为:
式(6)的计算只需要一张辅助图,实践发现式(6)的计算速度快于式(4)的计算3~4倍,这是检测系统实现实时性的重要一环;
3)将GPU加速检测算法应用于实时视频流
采用滑窗方式对待识别图像进行行人检测时,真实行人附近将出现大量的响应,这些响应被具体化为统一尺度下的矩形框,而虚假的目标则不会出现,根据此现象,制定后处理原则,局部响应小于等于三次的响应将被过滤,同一目标的多个响应合并为一个响应,被包含的矩形框将被移除,重叠区域超过一定比例的矩形框将被融合为一个,即可快速地、准确地检测出行人。
有益效果:本发明采用开源工具ffmpeg将接入的视频流进行解码,在采用多核混序拷贝将内存中的数据传输至GPU设备内存中,而后将位于GPU设备内存中的待识别图像数据进行多尺度缩放,最后对每一个尺度的待识别图像加载GPU加速检测算法,能够快速、准确对视频中出现的人进行检测,有效降低防卫人员的工作量。
附图说明
图1是本发明的较佳实施例的流程图。
图2(a~b)是本发明的较佳实施例中的GPU加速检测算法应用于实时视频流检测结果后处理被过滤示意图。
图3(a~b)是本发明的较佳实施例中的GPU加速检测算法应用于实时视频流检测结果后处理被融合示意图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
参见图1~图3所示一种使用GPU加速的实时行人检测系统,包括GPU设备,GPU设备为GTX980Ti,CPU为E5-1650v3 6核12线程,系统为Debian8.1,首先采用开源工具ffmpeg将接入的视频流进行解码,此时格式为RGB的视频存数据位于内存中,在采用多核混序拷贝将内存中的数据传输至GPU设备内存中,而后将位于GPU设备内存中的图像数据进行多尺度缩放,最后对每一个尺度的待识别图像加载GPU加速检测算法,进行实时行人检测,具体步骤如下:
1)训练行人检测模型
①数据集
使用INRIA数据集,INRIA数据集中用来训练的正样本有2416张,正样本的宽高分辨率有三个版本64x128、70x134、96x160,可供选择;而1218张分辨率不同的负样本只有一个版本,选择宽高分辨率为64x128的紧凑型(周围的背景较少)正样本,为了使CENTRIST特征更好的描述行人,将宽高分辨率为64x128的正样本裁剪为宽高分辨率为36x108的紧凑缩版正样本;
②建立分类器
在训练阶段,使用所有的正样本形成规模为2416的训练集P和规模为12180的负样本N1(在每一个负样本中随机选取位置截取10个36x108的矩形框形成),令NT←N1使用P∪NT训练得到一个线性SVM分类器H1;使用SVM分类器H1检测所有的负样本N1,将误识别为正样本的负样本称为难例,记为Nhard,令NT←NT∪Nhard(这一过程称之为Bootstrap流程),并重复难例这个流程,直到难例的数量为0,最终得到的线性SVM分类器记为HLIN;对于非线性HIK-SVM,同样使用上述Bootstrap流程方法训练,最终得到非线性SVM分类器记为HHIK;伪代码如下:
1 BEGIN
2 NT←N1
3 REPEAT
4 H←linearsvm_train(P∪NT)
5 Nhard←Bootstrap(N,H)
6 NT←{NT,Nhard}
8 HLIN←H
9 END
2)GPU加速检测算法
采用中心变换直方图特征CENTRIST(全称CENsus TRansform hISTogram,CENsusTRansform)结合CT变换(Census Transform)对训练行人检测模型中的样本图片进行检测,通过比较像素点与其周围像素灰度值的大小计算,计算方法如下:
使用高宽分辨率为36x108的检测窗口,将将训练行人检测模型中的每个样本图片划分9x4个块(每个块的尺寸为12x9)与邻近的2x2个块组成一个超级块,并提取每一个超级块的中心变换直方图特征,每一个检测窗口合计有8x3=24个超级块,故每一检测窗口将形成256x24=6144维的特征向量(CT变换后变量取值范围是[0~255],每一个超级块形成一个1x256的中心变换直方图);在计算中心变换直方图特征时,每一个超级块边界不需要考虑,因为CT变换需要3x3的区域;
将采集的训练行人检测模型样本图片进行灰度化处理得灰度图,在灰度图的基础上进行sobel变换;
待sobel变换后,继而进行CT变换得CT变换图,在CT变换图上加载GPU加速检测算法;
假设一个w∈R6144的线性SVM分类器,并将其按照从左到右,自上而下的顺序将w分割24个wi,j∈R256,i≤i≤8,1≤j≤3对应于每一个超级块,给定一张训练行人检测模型中的样本图片(大小为108x36),根据下式的正负判断是否包含行人:
(h,w)表达一个检测窗口,(hs,ws)=(h/9,w/4)表示一个块,则一个超级块为(2hs,2ws),给定一张训练行人检测模型中的样本图片I,S表示其sobel边缘图,S的CT变换图用C表示,对于左上角坐标为(t,l)的检测窗口,式(1)可以改写为:
其中,是wi,j第k个元素,C(x,y)是CT变换图C的一个像素点的值,x为2~2hs-1,以移除超级块的边界;
接下来创建多张辅助图Ai,j,1≤i≤8,1≤j≤3,辅助图的尺寸与训练行人检测模型中的样本图片I相同,设辅助图Ai,j位于(x,y)处的像素值为:
于是式(2)可写为:
使用积分图技巧,等式(4)中括号的部分仅需3次算术操作,因此式(4)的计算复杂度为0(1);
使用一张辅助图计算式(4),从而不需要显式地计算出每一个位置对应的特征f,具体方法如下,定义唯一一个辅助图A,
其中,nx=8,ny=3.故wTf可以写为:
式(6)的计算只需要一张辅助图,实践发现式(6)的计算速度快于式(4)的计算3~4倍,这是检测系统实现实时性的重要一环;
3)将GPU加速检测算法应用于实时视频流
采用滑窗方式对待识别图像进行行人检测时,真实行人附近将出现大量的响应,这些响应被具体化为统一尺度下的矩形框,而虚假的目标则不会出现,根据此现象,制定后处理原则,以有效过滤一些错误的响应,如图2(a~b)所示,图2a中的误检测不会滤掉,而图2b中的误检测将被过滤掉;局部响应小于等于三次的响应将被过滤,同一目标的多个响应合并为一个响应,被包含的矩形框将被移除,重叠区域超过一定比例的矩形框将被融合为一个,即可快速、准确检测出行人,如图3(a~b)所示。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (5)

1.一种使用GPU加速的实时行人检测系统,其特征在于,包括GPU设备,采用开源工具ffmpeg将接入的视频流进行解码,此时格式为RGB的视频存数据位于内存中,在采用多核混序拷贝将内存中的数据传输至GPU设备内存中,而后将位于GPU设备内存中的待识别图像数据进行多尺度缩放,最后对每一个尺度的待识别图像加载GPU加速检测算法,进行实时行人检测,具体步骤如下:
1)训练行人检测模型
①数据集
使用INRIA数据集,INRIA数据集中用来训练的正样本有2416张,1218张负样本;
②建立分类器
在训练阶段,使用所有的正样本形成规模为2416的训练集P和规模为1218的负样本N1,令NT←N1使用P∪NT训练得到一个线性SVM分类器H1;使用SVM分类器H1检测所有的负样本N1,将误识别为正样本的负样本称为难例,记为Nhard,令NT←NT∪Nhard,此过程称之为Bootstrap流程,并重复识别难例这个流程,直到难例的数量为0,最终得到的线性SVM分类器记为HLIN;对于非线性HIK-SVM,同样使用上述Bootstrap流程方法训练,最终得到非线性SVM分类器记为HHIK
2)GPU加速检测算法
采用中心变换直方图特征结合CT变换对训练行人检测模型的样本图片进行检测,通过比较像素点与其周围像素灰度值的大小计算,计算方法如下:
<mrow> <mtable> <mtr> <mtd> <mn>32</mn> </mtd> <mtd> <mn>64</mn> </mtd> <mtd> <mn>96</mn> </mtd> </mtr> <mtr> <mtd> <mn>32</mn> </mtd> <mtd> <mn>64</mn> </mtd> <mtd> <mn>96</mn> </mtd> </mtr> <mtr> <mtd> <mn>32</mn> </mtd> <mtd> <mn>32</mn> </mtd> <mtd> <mn>96</mn> </mtd> </mtr> </mtable> <mo>&amp;RightArrow;</mo> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow></mrow> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> <mo>&amp;RightArrow;</mo> <msub> <mrow> <mo>(</mo> <mn>11010110</mn> <mo>)</mo> </mrow> <mn>2</mn> </msub> <mo>&amp;RightArrow;</mo> <mi>C</mi> <mi>T</mi> <mo>=</mo> <mn>214</mn> </mrow>
使用高宽分辨率为36x108的检测窗口,将训练行人检测模型中的每个样本图片划分9x4个块与邻近的2x2个块组成一个超级块,并提取每一个超级块的中心变换直方图特征,每一个检测窗口合计有8x3=24个超级块,故每一检测窗口将形成256x24=6144维的特征向量,每一个超级块形成一个1x256的中心变换直方图;
将采集的训练行人检测模型样本图片进行灰度化处理得灰度图,在灰度图的基础上进行sobel变换;
待sobel变换后,继而进行CT变换得CT变换图,在CT变换图上加载GPU加速检测算法;
假设一个w∈R6144的线性SVM分类器,并将其按照从左到右,自上而下的顺序将w分割24个wi,j∈R256,i≤i≤8,1≤j≤3对应于每一个超级块,给定一个训练行人检测模型中的样本图片,宽高分辨率为108x36,根据下式的正负判断是否包含行人:
<mrow> <msup> <mi>w</mi> <mi>T</mi> </msup> <mi>f</mi> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>8</mn> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>3</mn> </munderover> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mi>T</mi> </msubsup> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>&amp;GreaterEqual;</mo> <mn>0.</mn> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
(h,w)表达一个检测窗口,(hs,ws)=(h/9,w/4)表示一个块,则一个超级块为(2hs,2ws),给定一张训练行人检测模型中的样本图片I,S表示其sobel边缘图,S的CT变换图用C表示,对于左上角坐标为(t,l)的检测窗口,式(1)为:
<mrow> <msup> <mi>w</mi> <mi>T</mi> </msup> <mi>f</mi> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>8</mn> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>3</mn> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>x</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mn>2</mn> <msub> <mi>h</mi> <mi>s</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>y</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mn>2</mn> <msub> <mi>w</mi> <mi>s</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mrow> <mi>C</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mo>(</mo> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> <msub> <mi>h</mi> <mi>s</mi> </msub> <mo>+</mo> <mi>x</mi> <mo>,</mo> <mi>l</mi> <mo>+</mo> <mo>(</mo> <mrow> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> <msub> <mi>w</mi> <mi>s</mi> </msub> <mo>+</mo> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow> 1
其中,第k个元素,C(x,y)是CT变换图C的一个像素点的值,x为2~2hs-1,以移除超级块的边界;
接下来创建多张辅助图Ai,j,1≤i≤8,1≤j≤3,辅助图的尺寸与训练行人检测模型中的样本图片I相同,设辅助图Ai,j位于(x,y)处的像素值为:
<mrow> <msubsup> <mi>A</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mrow> <mi>x</mi> <mo>,</mo> <mi>y</mi> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mrow> <mi>C</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
于是式(2)为:
<mrow> <msup> <mi>w</mi> <mi>T</mi> </msup> <mi>f</mi> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>8</mn> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>3</mn> </munderover> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>x</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mn>2</mn> <msub> <mi>h</mi> <mi>s</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>y</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mn>2</mn> <msub> <mi>w</mi> <mi>s</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msubsup> <mi>A</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mrow> <mi>t</mi> <mo>+</mo> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <msub> <mi>h</mi> <mi>s</mi> </msub> <mo>+</mo> <mi>x</mi> <mo>,</mo> <mi>l</mi> <mo>+</mo> <mrow> <mo>(</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <msub> <mi>w</mi> <mi>s</mi> </msub> <mo>+</mo> <mi>y</mi> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
使用积分图技巧,式(4)中括号的部分仅需3次算术操作,因此式(4)的计算复杂度为0(1);
使用一张辅助图计算式(4),从而不需要显式地计算出每一个位置对应的特征f,具体方法如下,定义唯一一个辅助图A,
<mrow> <mi>A</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <mi>x</mi> </msub> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <mi>y</mi> </msub> </munderover> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mrow> <mi>C</mi> <mrow> <mo>(</mo> <mo>(</mo> <mrow> <mi>i</mi> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> <msub> <mi>h</mi> <mi>s</mi> </msub> <mo>+</mo> <mi>x</mi> <mo>,</mo> <mo>(</mo> <mrow> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> <msub> <mi>w</mi> <mi>s</mi> </msub> <mo>+</mo> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
其中,nx=8,ny=3.故wTf为:
<mrow> <mi>A</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>x</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mn>2</mn> <msub> <mi>h</mi> <mi>s</mi> </msub> <mo>-</mo> <mn>12</mn> </mrow> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>y</mi> <mo>=</mo> <mn>2</mn> </mrow> <mrow> <mn>2</mn> <msub> <mi>w</mi> <mi>s</mi> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>A</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mi>x</mi> <mo>,</mo> <mi>l</mi> <mo>+</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>.</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>
式(6)的计算只需要一张辅助图,实践发现式(6)的计算速度快于式(4)的计算3~4倍,这是检测系统实现实时性的重要一环;
3)将GPU加速检测算法应用于实时视频流
采用滑窗方式对待识别图像进行行人检测时,真实行人附近将出现大量的响应,这些响应被具体化为统一尺度下的矩形框,而虚假的目标则不会出现,根据此现象,制定后处理原则,即可快速地、准确地检测出行人。
2.根据权利要求1所述的一种使用GPU加速的实时行人检测系统,其特征在于,正样本的宽高分辨率有三个版本64x128、70x134、96x160,负样本只有一个版本。
3.根据权利要求2所述的一种使用GPU加速的实时行人检测系统,其特征在于,选择宽高分辨率为64x128的紧凑型为正样本。
4.根据权利要求3所述的一种使用GPU加速的实时行人检测系统,其特征在于,为了更好描述行人,将宽高分辨率为64x128的正样本裁剪为宽高分辨率为36x108的紧凑缩版正样本。
5.根据权利要求1所述的一种使用GPU加速的实时行人检测系统,其特征在于,后处理原则是:局部响应小于等于三次的响应将被过滤,同一目标的多个响应合并为一个响应,被包含的矩形框将被移除,重叠区域超过一定比例的矩形框将被融合为一个。
CN201710463293.0A 2017-06-19 2017-06-19 一种使用gpu加速的实时行人检测系统 Pending CN107316320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710463293.0A CN107316320A (zh) 2017-06-19 2017-06-19 一种使用gpu加速的实时行人检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710463293.0A CN107316320A (zh) 2017-06-19 2017-06-19 一种使用gpu加速的实时行人检测系统

Publications (1)

Publication Number Publication Date
CN107316320A true CN107316320A (zh) 2017-11-03

Family

ID=60181889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710463293.0A Pending CN107316320A (zh) 2017-06-19 2017-06-19 一种使用gpu加速的实时行人检测系统

Country Status (1)

Country Link
CN (1) CN107316320A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564591A (zh) * 2018-05-18 2018-09-21 电子科技大学 一种保留局部边缘方向的图像边缘提取方法
CN109840498A (zh) * 2019-01-31 2019-06-04 华南理工大学 一种实时行人检测方法及神经网络、目标检测层
WO2023231159A1 (zh) * 2022-05-30 2023-12-07 来也科技(北京)有限公司 结合rpa和ai实现ia的图像检索方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548231B2 (en) * 2009-04-02 2013-10-01 Siemens Corporation Predicate logic based image grammars for complex visual pattern recognition
CN103473532A (zh) * 2013-09-06 2013-12-25 上海大学 机载平台快速行人检测系统和方法
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN105718841A (zh) * 2014-08-18 2016-06-29 无锡慧眼电子科技有限公司 一种对行人分类器实现动态更新的人数统计方法
US9449506B1 (en) * 2016-05-09 2016-09-20 Iteris, Inc. Pedestrian counting and detection at a traffic intersection based on location of vehicle zones
CN106503627A (zh) * 2016-09-30 2017-03-15 西安翔迅科技有限责任公司 一种基于视频分析的车辆避让行人检测方法
US9607402B1 (en) * 2016-05-09 2017-03-28 Iteris, Inc. Calibration of pedestrian speed with detection zone for traffic intersection control

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548231B2 (en) * 2009-04-02 2013-10-01 Siemens Corporation Predicate logic based image grammars for complex visual pattern recognition
CN103473532A (zh) * 2013-09-06 2013-12-25 上海大学 机载平台快速行人检测系统和方法
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN105718841A (zh) * 2014-08-18 2016-06-29 无锡慧眼电子科技有限公司 一种对行人分类器实现动态更新的人数统计方法
US9449506B1 (en) * 2016-05-09 2016-09-20 Iteris, Inc. Pedestrian counting and detection at a traffic intersection based on location of vehicle zones
US9607402B1 (en) * 2016-05-09 2017-03-28 Iteris, Inc. Calibration of pedestrian speed with detection zone for traffic intersection control
CN106503627A (zh) * 2016-09-30 2017-03-15 西安翔迅科技有限责任公司 一种基于视频分析的车辆避让行人检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
柳建为: "多特征融合的行人检测算法的研究和实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
董兰芳等: "基于GPU的高清视频图像行人检测方法研究", 《电子技术研发》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564591A (zh) * 2018-05-18 2018-09-21 电子科技大学 一种保留局部边缘方向的图像边缘提取方法
CN108564591B (zh) * 2018-05-18 2021-07-27 电子科技大学 一种保留局部边缘方向的图像边缘提取方法
CN109840498A (zh) * 2019-01-31 2019-06-04 华南理工大学 一种实时行人检测方法及神经网络、目标检测层
CN109840498B (zh) * 2019-01-31 2020-12-15 华南理工大学 一种实时行人检测方法及神经网络、目标检测层
WO2023231159A1 (zh) * 2022-05-30 2023-12-07 来也科技(北京)有限公司 结合rpa和ai实现ia的图像检索方法、装置及电子设备

Similar Documents

Publication Publication Date Title
Wang et al. Detection and localization of image forgeries using improved mask regional convolutional neural network
WO2017190574A1 (zh) 一种基于聚合通道特征的快速行人检测方法
Silva et al. A flexible approach for automatic license plate recognition in unconstrained scenarios
CN105512683B (zh) 基于卷积神经网络的目标定位方法及装置
Patel et al. License plate detection using Harris corner and character segmentation by integrated approach from an image
US20190138849A1 (en) Rotation variant object detection in deep learning
Yuan et al. Traffic sign detection via graph-based ranking and segmentation algorithms
CN105989334A (zh) 基于单目视觉的道路检测方法
CN107316320A (zh) 一种使用gpu加速的实时行人检测系统
Zhu et al. Deep residual text detection network for scene text
Kanter Color Crack: Identifying Cracks in Glass
CN110070486A (zh) 一种图像处理方法、装置及电子设备
Su et al. A new local-main-gradient-orientation HOG and contour differences based algorithm for object classification
Li et al. Feature extraction and tracking of CNN segmentations for improved road detection from satellite imagery
CN114067186B (zh) 一种行人检测方法、装置、电子设备及存储介质
CN108734123A (zh) 高速公路标志识别方法、电子设备、存储介质及系统
CN108241869A (zh) 一种基于快速可变形模型和机器学习的图像目标识别方法
JP2015088168A (ja) 学習サンプル生成装置、学習サンプル生成プログラム、及び自動認識装置
Wang et al. Deep learning-based human activity analysis for aerial images
Kumar et al. Intelligent parking vehicle identification and classification system
KR102416714B1 (ko) 3차원 이미지 및 딥러닝을 활용한 도시 규모 나무 지도 작성 시스템 및 방법
Surinwarangkoon et al. Traffic sign recognition by color filtering and particle swarm optimization
Nguyen et al. Triple detector based on feature pyramid network for license plate detection and recognition system in unusual conditions
CN107679528A (zh) 一种基于AdaBoost‑SVM集成学习算法的行人检测方法
CN112861860A (zh) 一种基于上下边界提取的自然场景下文字检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171103

RJ01 Rejection of invention patent application after publication