CN106845503A - 一种Hog并行化设计方法及系统 - Google Patents

一种Hog并行化设计方法及系统 Download PDF

Info

Publication number
CN106845503A
CN106845503A CN201710052403.4A CN201710052403A CN106845503A CN 106845503 A CN106845503 A CN 106845503A CN 201710052403 A CN201710052403 A CN 201710052403A CN 106845503 A CN106845503 A CN 106845503A
Authority
CN
China
Prior art keywords
image block
data
block
hog
evolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710052403.4A
Other languages
English (en)
Other versions
CN106845503B (zh
Inventor
鹿鹏
龙刚
林宋伟
李斐
周朝阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhizunbao Investment Holding Co ltd
Original Assignee
Shenzhen Protruly Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Protruly Electronic Co Ltd filed Critical Shenzhen Protruly Electronic Co Ltd
Priority to CN201710052403.4A priority Critical patent/CN106845503B/zh
Publication of CN106845503A publication Critical patent/CN106845503A/zh
Application granted granted Critical
Publication of CN106845503B publication Critical patent/CN106845503B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Abstract

本发明公开了一种Hog并行化设计方法及系统,所述方法在对图像原始数据进行运算时,先对图像原始数据进行开方,再将开方后的数据作为后续计算的数据源,相对于现有的Hog设计,减少了n‑1次的开方运算,提高了运算效率;进一步,本发明将缩放、求幅度和角度值合并成一个并行方案,相对于现有的Hog设计,减少了cuda核心对存储器宽带的依赖,提高了cuda核心的执行效率;更进一步,通过对直方图并行化进行改进,实现了一个线程block输出两个图像块的直方图,相对于现有的Hog设计,本发明的其执行效率更高。

Description

一种Hog并行化设计方法及系统
技术领域
本发明涉及图像识别领域,尤其涉及的是一种Hog并行化设计方法及系统。
背景技术
方向梯度直方图(Histogram of oriented gradient,Hog)特征是一种在计算机和图像处理中用来进行物体的特征描述子,Hog特征结合SVM分类器已经被广泛应用于图像识别中。
现有的Hog算法主要是使用C语言或cuda实现,结合SVM分类器从输入的灰度图中检测出目标,在现有的Hog并行化方案中,首先需要对输入的数据进行缩放,并将缩放后的数据开方后再传输给求幅度角度模块,然后将所求得的幅度和角度传递给直方图模块求得直方图,最后进行归一化直方图处理和求SVM值;现有Hog方案的流程图如图1所示,每一个框图都代表了一个并行化过程,每个并行化过程都是通过显存进行数据通信的;
然而在cuda应用程序设计中,通过显存进行的数据的通信带宽是很小的,以至于现有Hog并行化方案中,制约着系统性能的主要因素是存储器的带宽,并且由于Hog的程序结构不合理,浪费了宝贵的计算资源;其次,部分程序结构多次访问存储器空间也会导致图像处理效率变低。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种Hog并行化设计方法及系统,旨在解决现有Hog并行化方案受限于存储器的带宽,并且现有Hog的程序结构不合理,浪费了宝贵的计算资源;以及部分程序结构多次访问存储器空间导致图像处理效率低的问题。
本发明的技术方案如下:
一种Hog并行化设计改进方法,其中,包括步骤:
A、对输入的原始图像进行分块得到多个图像块,并将所述多个图像块分配给相应的线程块;
B、对所述图像块的像素数据进行开方处理,得到开方数据;
C、将所述开方数据进行缩放,并将缩放后的数据直接从数据源中映射并取出,进行幅度和角度的计算,从而得到图像块的幅度数据和角度数据;
D、根据所述图像块的幅度数据和角度数据进行直方图统计,得到各个图像块的直方图;
E、对所述多个图像块的直方图进行归一化处理,得到原始图像的Hog特征值。
所述的Hog并行化设计改进方法,其中,所述步骤A具体包括:
A1、对输入的原始图像进行分块,得到多个图像块;
A2、将所述多个图像块输入到GPU中,对所述多个图像块分配执行资源,从而将所述多个图像块分配给相应的线程块。
所述的Hog并行化设计改进方法,其中,所述步骤B具体包括:
B1、对所述图像块的像素数据进行灰度化处理,得到图像块的灰度值;
B2、对所述图像块的灰度值进行开方校正,得到图像块的开方数据。
所述的Hog并行化设计改进方法,其中,所述步骤C具体包括:
C1、对图像块的开方数据进行缩放,缩放公式为: 其中,fscale=1.06n,n∈[0,18),n为缩放次数;wide为图像块的原始宽度,height为图像块的原始高度;wide’为图像块缩放后的宽度,height’为图像块缩放后的高度;
C2、所述幅度值的计算公式为:所述角度值的计算公式为:其中,I(x1+1,y1)-I(x1-1,y1)为图像块中像素点(x,y)处的水平方向梯度,I(x1,y1+1)-I(x1,y1-1)图像块中像素点(x,y)处的垂直方向梯度。
所述的Hog并行化设计改进方法,其中,所述步骤D具体包括:
D1、将图像块分成4个cell权重矩阵,所述4个cell权重矩阵分别为cell0、cell1、cell2和cell3;
D2、分别计算图像块中与所述4个cell权重矩阵分量计算有关的值,得到4个对cell权重矩阵有影响的区域;
D3、将所述4个对cell权重矩阵有影响的区域分别投影到直方图的长度范围内,得到图像块的统计直方图。
一种Hog并行化设计改进系统,其中,包括:
分块模块,用于对输入的原始图像进行分块得到多个图像块,并将所述多个图像块分配给相应的线程块;
开方模块,用于对所述图像块的像素数据进行开方处理,得到开方数据;
数据计算模块,用于将所述开方数据进行缩放,并将缩放后的数据直接从数据源中映射并取出,进行幅度和角度的计算,从而得到图像块的幅度数据和角度数据;
统计模块,用于根据所述图像块的幅度数据和角度数据进行直方图统计,得到各个图像块的直方图;
归一化模块,用于对所述多个图像块的直方图进行归一化处理,得到原始图像的Hog特征值。
所述的Hog并行化设计改进系统,其中,所述分块模块具体包括:
分块单元,用于对输入的原始图像进行分块,得到多个图像块;
分配单元,用于将所述多个图像块输入到GPU中,对所述多个图像块分配执行资源,从而将所述多个图像块分配给相应的线程块。
所述的Hog并行化设计改进系统,其中,所述开方模块具体包括:
灰度处理单元,用于对所述图像块的像素数据进行灰度化处理,得到图像块的灰度值;
开方校正单元,用于对所述图像块的灰度值进行开方校正,得到图像块的开方数据。
所述的Hog并行化设计改进系统,其中,所述数据计算模块具体包括:
缩放单元,用于对图像块的开方数据进行缩放,缩放公式为: 其中,fscale=1.06n,n∈[0,18),n为缩放次数;wide为图像块的原始宽度,height为图像块的原始高度;wide’为图像块缩放后的宽度,height’为图像块缩放后的高度;
幅度及角度计算单元,用于计算图像块的幅度值和角度值,所述幅度值的计算公式为:所述角度值的计算公式为:其中,I(x1+1,y1)-I(x1-1,y1)为图像块中像素点(x,y)处的水平方向梯度,I(x1,y1+1)-I(x1,y1-1)为图像块中像素点(x,y)处的垂直方向梯度。
所述的Hog并行化设计改进系统,其中,所述统计模块具体包括:
矩阵划分单元,用于将图像块分成4个cell权重矩阵,所述4个cell权重矩阵分别为cell0、cell1、cell2和cell3;
区域计算单元,用于分别计算图像块中与所述4个cell权重矩阵分量计算有关的值,得到4个对cell权重矩阵有影响的区域;
投影单元,用于将所述4个对cell权重矩阵有影响的区域分别投影到直方图的长度范围内,得到图像块的统计直方图。
有益效果:本发明相对于现有的Hog并行化设计,在运算效率上有明显的提升,具体体现在以下几个方面:
1、本发明先对图像块的灰度图直接进行一次开方处理,然后将开方后的数据作为数据源进行n次缩放、幅度角度计算等后续操作;而现有的Hog设计在对灰度图缩放n次的同时,也会进行n次开方运算,因此,相对于现有的Hog设计,本发明的Hog设计减少了n-1次的开方运算,提高了运算效率;
2、本发明将缩放与求幅度角度值统一进行,通过将缩放的数据直接从数据源中映射并取出,然后进行幅度和角度的计算,缩放的过程在逻辑上是存在的,但是不会使用存储器作为中间数据的存储,因此,相对于现有的Hog设计,本发明减少了cuda核心对存储器宽带的依赖,提高了cuda核心的执行效率;
3、本发明在直方图统计过程中,通过计算对cell权重矩阵有影响的区域,并将所述区域投影到直方图相应的长度范围内,可实现一个线程块输出两个图像块的直方图,相对于现有的Hog设计,本发明的其执行效率更高。
附图说明
图1为现有技术中Hog并行化设计方法的流程示意图。
图2为本发明一种Hog并行化设计方法较佳实施例的流程图。
图3为本发明Hog并行化设计方法的流程示意图。
图4为本发明中对图像块进行资源分配的示意图。
图5为本发明中cell与cell之间互相影响的区域示意图。
图6为本发明中图像块的投影示意图。
图7为本发明中线程块内部的计算分配方式示意图。
具体实施方式
本发明提供一种Hog并行化设计方法及系统,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图2和图3,图2为本发明一种Hog并行化设计方法较佳实施例的流程图,如图所示,其包括步骤:
S100、对输入的原始图像进行分块得到多个图像块,并将所述多个图像块分配给相应的线程块;
具体地,在对图像进行Hog并行化设计之前,需要对输入的图像进行分块,图像分块有两种方式,一种是分割出的图像块互相有交叠,另一种是分割出的图像块互相之间没有交叠;本发明优选没有交叠的分块方式。将分块后的图像输入到GPU中,在并行化系统中对图像块分配执行资源,如图4所示。
进一步,所述步骤S100具体包括:
S110、对输入的原始图像进行分块,得到多个图像块;
S120、将所述多个图像块输入到GPU中,对所述多个图像块分配执行资源,从而将所述多个图像块分配给相应的线程块。
具体地,在本发明中,当原始图像被分割成多个图像块之后,每个图像块均被分配给一个或多个线程块执行运算,如图4所示,所述线程块与线程块之间是并行执行的,所以从宏观上看,一幅图像被分割成了多个图像块,对其进行GPU资源分配后,所述多个图像块是同时执行运算处理的。
S200、对所述图像块的像素数据进行开方处理,得到开方数据,其具体包括:
S210、对所述图像块的像素数据进行灰度化处理,得到图像块的灰度值;
具体地,可采用分量法对图像块的像素数据进行灰度化处理,通过将彩色图像中的三分量的亮度作为三个灰度图像的灰度值,可根据应用需要选取一种灰度图像;通过灰度化处理可得到图像块的灰度值;
S220、对所述图像块的灰度值进行开方校正,得到图像块的开方数据;具体地,通过开方校正对输入图像进行颜色空间的标准化(归一化),目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时还可以抑制噪音的干扰;开方主要是实现数据校正的运算方法,即将输入的数据开平方后再写入到原来的位置,示例如下:即开方校正后,数据由原来的整数变成了单精度浮点数,后续的运算都是浮点数处理。
由于现有的Hog并行化是针对通用性考虑的,所以当原始灰度图进入到现有Hog并行化系统后,先做缩放,缩放过后再由用户选择是否开方。而本发明的Hog并行化过程是先做开方运算,即当原始灰度图进入到本专利的Hog并行化系统后,直接做开方,然后将开方后的数据又做为数据源给后续的操作。由于进入系统的灰度图会缩放n次,若选择现有的Hog,那么在缩放n次的同时,也会进行n次开方运算。而本发明对于一幅灰度只需要做一次开方运算,然后再缩放n次,相对于现有的Hog,减少了n-1次的开方运算,提高了运算效率。
S300、将所述开方数据进行缩放,并将缩放后的数据直接从数据源中映射并取出,进行幅度和角度的计算,从而得到图像块的幅度数据和角度数据;
具体地,对数据进行开方处理后,需要将得到的开方数据进行缩放处理,wide和height分别表示缩放前的图像块的宽和高,在缩放过程中,每一层缩放后的wide’和height’的大小都是不一样的,wide’和height’的计算是在CPU端进行的,缩放后wide’和height’要保证是8的整数倍,计算公式如下所示:其中,fscale=1.06n,n∈[0,18),n为缩放次数;wide为图像块的原始宽度,height为图像块的原始高度;wide’为图像块缩放后的宽度,height’为图像块缩放后的高度;进一步,本发明优选对开方数据进行18层缩放。
进一步,在进行缩放过程中,需要从纹理存储器(texRef)中读取数据,待缩放的矩阵texRef是(wide+2)*(height+2),且矩阵四周的边界点都为0,这样做的目的是在缩放时可以排除原矩阵wide*height在边界点上的处理过程与非边界点上的处理过程不一致的情况,在CUDA并行设计中可以消除if……else……语句。纹理存储器自己提供一种边界处理机制,超出矩阵的存储空间大小后默认为0或是其他值,这样做的最大的好处是使纹理存储器空间大小与现实数据的大小相匹配;
线程发射时,开启的线程数正好与缩放后的矩阵大小wide’和height’相对应,网格维度和线程块可以自己定,只要开启了wide’*height’个线程都可以,在缩放过程中,就不存储中间的缩放结果。
在进行A和θ的计算之前,需要抽象的取出图像块的上下左右四个点。设缩放后的某一点为(x,y),x∈[0,wide′),y∈[0,height′)。由缩放后的点位置对应到原点的位置公式L(x’,y’,z’),其中x’、y’、z’为变量:每个cuda核函数计算缩放后的一点,设index为当前核函数对应的线程号,此缩放后的某一点(x,y)的计算公式如下所示:index=blockIdx.x*blockDim.x+threadIdx.x;在当前核函数内部申请四个寄存器为fTop,fBottom,fLeft和fRight,分别对应当前缩放后的位置点(x,y-1)、(x,y+1)、(x-1,y)和(x+1,y)的值。因为texRef的边界点都为0,所以为了能够准确的映射到原texRef的值,计算时应该在横向x和纵向y上都各自加1。这四个点的计算公式如下所示(其中text2D(texRef,x”,y”)表示从纹理存储器texRef的位置(x”,y”)中拾取的值):fTop=text2D(texRef,L(x+1,wide,wide′),L(y,height,height′));fLeft=text2D(texRef,L(x,wide,wide′),L(y+1,height,height′));fRight=text2D(texRef,L(x+2,wide,wide′),L(y+1,height,height′));fBottom=text2D(texRef,L(x+1,wide,wide′),L(y+2,height,height′));
进一步,当输入的缩放数据为m*n(m为宽,n为高)的矩阵,那么经过此步骤后输出可以看成是两个m*n的矩阵,分别为幅度A矩阵和角度θ矩阵;设输入矩阵为I,维度为m*n;输出矩阵为O,维度为m*n;设矩阵I和矩阵O中任一位置为(x1,y1),x1∈[0,m-1],y1∈[0,n-1],对于矩阵之外位置时,为了方便计算,都设为0。
所述幅度值A的计算公式为:所述角度值θ的计算公式为:其中,I(x1+1,y1)-I(x1-1,y1)为图像块中像素点(x,y)处的水平方向梯度,I(x1,y1+1)-I(x1,y1-1)图像块中像素点(x,y)处的垂直方向梯度。经过上述的求角度的θ的公式,求出的Oθ(x1,y1)是弧度表示的,范围为将其转换为角度的公式为Oθ(x1,y1)乘以后存入相应位置。转化成Oθ(x1,y1)角度表示后,若值是小于0的,那么再加上180,使其变成正的,公式为Oθ(x1,y1)=Oθ(x1,y1)+180;要限制Oθ(x1,y1)的取值范围在[0,180]内。
在现有的Hog方案中,缩放与求幅度和角度并行化模块是分开的,若将缩放后的数据传递给后续模块运行,需要通过存储器做为数据传输的通道,存储器访问次数会增加,Hog并行化系统的效率在这里受到了存储器带宽的限制;而在本发明中,将缩放与求幅度角度统一计算,将缩放后的数据直接从数据源中映射并取出,然后进行幅度和角度的计算,缩放的过程在逻辑上是存在的,但是不会使用存储器做为中间数据的存储,所以本发明相对于现有的hog,减少了cuda核心对存储器带宽的依赖,提高了cuda核心的执行效率。
S400、根据所述图像块的幅度数据和角度数据进行直方图统计,得到各个图像块的直方图,其具体包括:
S410、将图像块分成4个cell权重矩阵,所述4个cell权重矩阵分别为cell0、cell1、cell2和cell3;
S420、分别计算图像块中与所述4个cell权重矩阵分量计算有关的值,得到4个对cell权重矩阵有影响的区域;
S430、将所述4个对cell权重矩阵有影响的区域分别投影到直方图的长度范围内,得到图像块的统计直方图。
具体来说,一个图像块(block)分成4个cell,block大小为8*8,cell大小为4*4;在现有Hog设计中,是假设一个cell中的所有数据对其他3个cell都有影响,这样造成的问题是在并行化设计中不仅计算量大,而且共享存储器也会被大量使用,为了避免出现共享存储器内数据不一致的情况,会额外增加大量的同步的操作,从而导致程序运行效率降低。
实际上,每个cell并不是所有的数据都对其他的cell有影响,cell与cell之间相互影响的结构如图5所述。在本发明中,每一个图像块内,每个点有四个cell权重矩阵,分别为cell0权重矩阵、cell1权重矩阵、cell2权重矩阵和cell3权重矩阵,每个cell权重矩阵的维度为6*6(与对cell有影响的区域大小相对应),每个矩阵的初使化都为1;cell0权重矩阵与对cell0有影响的区域相乘后,得到图像block的所有cell0分量计算有关的值。同理cell1权重矩阵与对cell1有影响的区域相乘后,得到图像block的所有与cell1分量计算有关的值。cell2权重矩阵与对cell2有影响的区域相乘后,得到图像block的所有与cell2分量计算有关的值。cell3权重矩阵与对cell3有影响的区域相乘后,得到图像block的所有与cell3分量计算有关的值。
进一步,将cell0及与cell0有影响的区域投影到直方图的0-8范围内;cell1及与cell1有影响的区域投影到直方图的9-17范围内;cell2及与cell2有影响的区域投影到直方图的18-26范围内;cell3及与cell3有影响的区域投影到直方图的27-35范围内;投影过程如图6所示。
由于一个线程block中有64个线程,在本发明中,每个线程block可处理两个图像block,如图7所示。也就是说,虽然本发明的线程块维度也为8x8,在时间复杂度上与现有的Hog设计一样,但是本发明中一个线程块可以输出两个图像块的直方图,所以相对于较现有的Hog并行化方案,本发明的执行效率要高得多。
S500、对所述多个图像块的直方图进行归一化处理,得到原始图像的Hog特征值。
具体来说,由于局部光照的变化以及前景-背景对比度的变化,使得梯度强度的变化范围非常大,因此需要对梯度强度做归一化处理;较佳地,把各个cell单元组合成大的、空间上连通的区间。这样,一个图像块内所有cell的特征向量串联起来便得到该图像块的Hog特征,将归一化之后的图像块描述符(向量)就称之为Hog特征值。
基于上述方法,本发明还提供一种Hog并行化设计改进系统,其中,包括:
分块模块100,用于对输入的原始图像进行分块得到多个图像块,并将所述多个图像块分配给相应的线程块;
开方模块200,用于对所述图像块的像素数据进行开方处理,得到开方数据;
数据计算模块300,用于将所述开方数据进行缩放,并将缩放后的数据直接从数据源中映射并取出,进行幅度和角度的计算,从而得到图像块的幅度数据和角度数据;
统计模块400,用于根据所述图像块的幅度数据和角度数据进行直方图统计,得到各个图像块的直方图;
归一化模块500,用于对所述多个图像块的直方图进行归一化处理,得到原始图像的Hog特征值。
所述的Hog并行化设计改进系统,其中,所述分块模块100具体包括:
分块单元,用于对输入的原始图像进行分块,得到多个图像块;
分配单元,用于将所述多个图像块输入到GPU中,对所述多个图像块分配执行资源,从而将所述多个图像块分配给相应的线程块。
所述的Hog并行化设计改进系统,其中,所述开方模块200具体包括:
灰度处理单元,用于对所述图像块的像素数据进行灰度化处理,得到图像块的灰度值;
开方校正单元,用于对所述图像块的灰度值进行开方校正,得到图像块的开方数据。
所述的Hog并行化设计改进系统,其中,所述数据计算模块300具体包括:
缩放单元,用于对图像块的开方数据进行缩放,缩放公式为:其中,fscale=1.06n,n∈[0,18),n为缩放次数;wide为图像块的原始宽度,height为图像块的原始高度;wide’为图像块缩放后的宽度,height’为图像块缩放后的高度;
幅度及角度计算单元,用于计算图像块的幅度值和角度值,所述幅度值的计算公式为:所述角度值的计算公式为:其中,I(x1+1,y1)-I(x1-1,y1)为图像块中像素点(x,y)处的水平方向梯度,I(x1,y1+1)-I(x1,y1-1)为图像块中像素点(x,y)处的垂直方向梯度。
所述的Hog并行化设计改进系统,其中,所述统计模块400具体包括:
矩阵划分单元,用于将图像块分成4个cell权重矩阵,所述4个cell权重矩阵分别为cell0、cell1、cell2和cell3;
区域计算单元,用于分别计算图像块中与所述4个cell权重矩阵分量计算有关的值,得到4个对cell权重矩阵有影响的区域;
投影单元,用于将所述4个对cell权重矩阵有影响的区域分别投影到直方图的长度范围内,得到图像块的统计直方图。
综上所述,本发明提供一种Hog并行化设计方法及系统,相对于现有的Hog设计,本发明的Hog设计减少了n-1次的开方运算,提高了运算效率;减少了cuda核心对存储器宽带的依赖,提高了cuda核心的执行效率;实现了一个线程块输出两个图像块的直方图,提高了执行效率。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,例如,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种Hog并行化设计改进方法,其特征在于,包括步骤:
A、对输入的原始图像进行分块得到多个图像块,并将所述多个图像块分配给相应的线程块;
B、对所述图像块的像素数据进行开方处理,得到开方数据;
C、将所述开方数据进行缩放,并将缩放后的数据直接从数据源中映射并取出,进行幅度和角度的计算,从而得到图像块的幅度数据和角度数据;
D、根据所述图像块的幅度数据和角度数据进行直方图统计,得到各个图像块的直方图;
E、对所述多个图像块的直方图进行归一化处理,得到原始图像的Hog特征值。
2.根据权利要求1所述的Hog并行化设计改进方法,其特征在于,所述步骤A具体包括:
A1、对输入的原始图像进行分块,得到多个图像块;
A2、将所述多个图像块输入到GPU中,对所述多个图像块分配执行资源,从而将所述多个图像块分配给相应的线程块。
3.根据权利要求1所述的Hog并行化设计改进方法,其特征在于,所述步骤B具体包括:
B1、对所述图像块的像素数据进行灰度化处理,得到图像块的灰度值;
B2、对所述图像块的灰度值进行开方校正,得到图像块的开方数据。
4.根据权利要求1所述的Hog并行化设计改进方法,其特征在于,所述步骤C具体包括:
C1、对图像块的开方数据进行缩放,缩放公式为:其中,fscale=1.06n,n∈[0,18),n为缩放次数;wide为图像块的原始宽度,height为图像块的原始高度;wide’为图像块缩放后的宽度,height’为图像块缩放后的高度;
C2、所述幅度值的计算公式为:所述角度值的计算公式为:其中,I(x1+1,y1)-I(x1-1,y1)为图像块中像素点(x,y)处的水平方向梯度,I(x1,y1+1)-I(x1,y1-1)图像块中像素点(x,y)处的垂直方向梯度。
5.根据权利要求1所述的Hog并行化设计改进方法,其特征在于,所述步骤D具体包括:
D1、将图像块分成4个cell权重矩阵,所述4个cell权重矩阵分别为cell0、cell1、cell2和cell3;
D2、分别计算图像块中与所述4个cell权重矩阵分量计算有关的值,得到4个对cell权重矩阵有影响的区域;
D3、将所述4个对cell权重矩阵有影响的区域分别投影到直方图的长度范围内,得到图像块的统计直方图。
6.一种Hog并行化设计改进系统,其特征在于,包括:
分块模块,用于对输入的原始图像进行分块得到多个图像块,并将所述多个图像块分配给相应的线程块;
开方模块,用于对所述图像块的像素数据进行开方处理,得到开方数据;
数据计算模块,用于将所述开方数据进行缩放,并将缩放后的数据直接从数据源中映射并取出,进行幅度和角度的计算,从而得到图像块的幅度数据和角度数据;
统计模块,用于根据所述图像块的幅度数据和角度数据进行直方图统计,得到各个图像块的直方图;
归一化模块,用于对所述多个图像块的直方图进行归一化处理,得到原始图像的Hog特征值。
7.根据权利要求6所述的Hog并行化设计改进系统,其特征在于,所述分块模块具体包括:
分块单元,用于对输入的原始图像进行分块,得到多个图像块;
分配单元,用于将所述多个图像块输入到GPU中,对所述多个图像块分配执行资源,从而将所述多个图像块分配给相应的线程块。
8.根据权利要求6所述的Hog并行化设计改进系统,其特征在于,所述开方模块具体包括:
灰度处理单元,用于对所述图像块的像素数据进行灰度化处理,得到图像块的灰度值;
开方校正单元,用于对所述图像块的灰度值进行开方校正,得到图像块的开方数据。
9.根据权利要求6所述的Hog并行化设计改进系统,其特征在于,所述数据计算模块具体包括:
缩放单元,用于对图像块的开方数据进行缩放,缩放公式为: 其中,fscale=1.06n,n∈[0,18),n为缩放次数;wide为图像块的原始宽度,height为图像块的原始高度;wide’为图像块缩放后的宽度,height’为图像块缩放后的高度;
幅度及角度计算单元,用于计算图像块的幅度值和角度值,所述幅度值的计算公式为:所述角度值的计算公式为:其中,I(x1+1,y1)-I(x1-1,y1)为图像块中像素点(x,y)处的水平方向梯度,I(x1,y1+1)-I(x1,y1-1)图像块中像素点(x,y)处的垂直方向梯度。
10.根据权利要求6所述的Hog并行化设计改进系统,其特征在于,所述统计模块具体包括:
矩阵划分单元,用于将图像块分成4个cell权重矩阵,所述4个cell权重矩阵分别为cell0、cell1、cell2和cell3;
区域计算单元,用于分别计算图像块中与所述4个cell权重矩阵分量计算有关的值,得到4个对cell权重矩阵有影响的区域;
投影单元,用于将所述4个对cell权重矩阵有影响的区域分别投影到直方图的长度范围内,得到图像块的统计直方图。
CN201710052403.4A 2017-01-22 2017-01-22 一种Hog并行化设计方法及系统 Expired - Fee Related CN106845503B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710052403.4A CN106845503B (zh) 2017-01-22 2017-01-22 一种Hog并行化设计方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710052403.4A CN106845503B (zh) 2017-01-22 2017-01-22 一种Hog并行化设计方法及系统

Publications (2)

Publication Number Publication Date
CN106845503A true CN106845503A (zh) 2017-06-13
CN106845503B CN106845503B (zh) 2018-04-17

Family

ID=59120782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710052403.4A Expired - Fee Related CN106845503B (zh) 2017-01-22 2017-01-22 一种Hog并行化设计方法及系统

Country Status (1)

Country Link
CN (1) CN106845503B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182442A (zh) * 2017-12-29 2018-06-19 惠州华阳通用电子有限公司 一种图像特征提取方法
CN109063683A (zh) * 2018-08-28 2018-12-21 第六镜科技(北京)有限公司 人脸检测方法及系统
CN110706146A (zh) * 2019-09-26 2020-01-17 北京机电工程研究所 图像处理方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760053A (zh) * 2012-06-20 2012-10-31 东南大学 基于cuda并行计算及wcf架构的人体检测方法
JP2015191568A (ja) * 2014-03-28 2015-11-02 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
CN105930794A (zh) * 2016-04-20 2016-09-07 东北大学 一种基于云计算的室内场景识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760053A (zh) * 2012-06-20 2012-10-31 东南大学 基于cuda并行计算及wcf架构的人体检测方法
JP2015191568A (ja) * 2014-03-28 2015-11-02 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
CN105930794A (zh) * 2016-04-20 2016-09-07 东北大学 一种基于云计算的室内场景识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182442A (zh) * 2017-12-29 2018-06-19 惠州华阳通用电子有限公司 一种图像特征提取方法
CN109063683A (zh) * 2018-08-28 2018-12-21 第六镜科技(北京)有限公司 人脸检测方法及系统
CN109063683B (zh) * 2018-08-28 2022-02-11 第六镜科技(北京)集团有限责任公司 人脸检测方法及系统
CN110706146A (zh) * 2019-09-26 2020-01-17 北京机电工程研究所 图像处理方法和装置

Also Published As

Publication number Publication date
CN106845503B (zh) 2018-04-17

Similar Documents

Publication Publication Date Title
US11610362B2 (en) Data volume sculptor for deep learning acceleration
CN109949255B (zh) 图像重建方法及设备
US9117262B2 (en) Learned piece-wise patch regression for image enhancement
CN110196053B (zh) 一种基于fpga的实时田间机器人视觉导航方法与系统
CN111860398B (zh) 遥感图像目标检测方法、系统及终端设备
DE102018117813A1 (de) Zeitlich stabile Datenrekonstruktion mit einem externen rekurrenten neuronalen Netzwerk
US10977560B2 (en) Efficient decision tree traversal in an adaptive boosting (AdaBoost) classifier
CN109993707B (zh) 图像去噪方法和装置
CN111310775A (zh) 数据训练方法、装置、终端设备及计算机可读存储介质
CN110473137A (zh) 图像处理方法和装置
CN106845503B (zh) 一种Hog并行化设计方法及系统
CN111985458B (zh) 一种检测多目标的方法、电子设备及存储介质
CN111340077B (zh) 基于注意力机制的视差图获取方法和装置
CN112529146B (zh) 神经网络模型训练的方法和装置
US11875486B2 (en) Image brightness statistical method and imaging device
CN110675334A (zh) 一种图像增强方法及装置
CN110059793B (zh) 生成式对抗神经网络的逐步修改
CN111465943A (zh) 芯片上计算网络
CN112614140A (zh) 一种训练色斑检测模型的方法及相关装置
CN106780415B (zh) 一种直方图统计电路及多媒体处理系统
Chang et al. Efficient stereo matching on embedded GPUs with zero-means cross correlation
US20200342276A1 (en) Normalization method for machine-learning and apparatus thereof
CN113554657A (zh) 基于注意力机制及卷积神经网络的超像素分割方法及系统
CN113506305A (zh) 三维点云数据的图像增强方法、语义分割方法及装置
DE102019101845B4 (de) Photorealistische Bildstilisierung unter Verwendung eines Neuronalen-Netzwerkmodells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Lu Peng

Inventor after: Long Gang

Inventor after: Lin Songwei

Inventor after: Li Fei

Inventor after: Zhou Chaoyang

Inventor after: Chen Xianwen

Inventor after: Cai Sixia

Inventor after: Liu Xiang

Inventor after: Wei Guo

Inventor before: Lu Peng

Inventor before: Long Gang

Inventor before: Lin Songwei

Inventor before: Li Fei

Inventor before: Zhou Chaoyang

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220120

Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Patentee after: Shenzhen Zhizunbao Investment Holding Co.,Ltd.

Address before: 518000 floor 1-3, building 9, Huafu Industrial Park, Huachang Road, Langkou community, Dalang street, Longhua New District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN PROTRULY ELECTRONICS Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180417