CN110866420A - 一种基于光场相机和hog、svm的2d欺骗性行人识别方法 - Google Patents
一种基于光场相机和hog、svm的2d欺骗性行人识别方法 Download PDFInfo
- Publication number
- CN110866420A CN110866420A CN201810985456.6A CN201810985456A CN110866420A CN 110866420 A CN110866420 A CN 110866420A CN 201810985456 A CN201810985456 A CN 201810985456A CN 110866420 A CN110866420 A CN 110866420A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- svm
- hog
- light field
- deceptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000002474 experimental method Methods 0.000 claims abstract description 8
- 238000012706 support-vector machine Methods 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 3
- 238000005286 illumination Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108091008695 photoreceptors Proteins 0.000 description 2
- 230000036544 posture Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Traffic Control Systems (AREA)
- Image Analysis (AREA)
Abstract
一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,包括如下步骤:①利用光场相机去拍摄大量行人图像和非行人图像,作为实验的正样本和负样本;②利用Lytro Desktop软件得到所拍摄图像的原始2D图像和景深图;③利用HOG+SVM进行对原始2D图像进行ROI区域提取,判断是否包括行人;④再次利用HOG+SVM对步骤③中判断为行人的景深图进行识别,判断是否包括欺骗性行人。本发明利用光场相机可以获取图像景深图的特点来消除由于2D欺骗性打印人体图像或人物海报造成的误识别,以增强行人的识别能力。
Description
技术领域
本发明属于模式识别和人工智能领域,特别涉及一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法。
背景技术
随着科技的进步与社会的发展,许多需要大量人力完成的工作现在可以交给计算机完成,计算机视觉就是近期的研究热点,计算机视觉的目标就是利用计算机去代替人的视觉能力来处理问题。
行人识别是计算机视觉研究领域的一个重要组成部分是物体识别的重要分支,在无人驾驶、辅助驾驶、智能机器人等领域都起到了十分重要的应用。并且近年来,随着拍照设备等硬件产品的进步,工业界对行人识别效率和准确度提出了更加苛刻的要求。
行人识别首要就是识别出行人,然而在现实生活中行人在穿着、形态变化、所处背景、光照条件都不尽相同,会对行人识别产生挑战。并且在生活中广泛存在着2D欺骗性打印人体照片或者人物海报,这对行人识别是致命的影响,会极大的造成误识别,降低识别准确率。
传统的行人识别中一个重要的特点是所应用的相机精度能达到要求,但都属于传统的二维相机,拍照只能得到相应图像的二维信息,不能获取场景深度信息,所以对2D欺骗性打印人体照片、人物海报就会造成误识别。例如在商场里存在的人物的宣传海报(包含整体人物图像)或者打印的人体图像,这些情况的存在都会对传统的行人识别提出挑战,尽管我们可以一眼就看出这不是真人,但计算机不会。最早的行人识别相关研究是在2005年CVPR会议上发表的SVM+HOG的算法,这是第一次提出梯度直方图(HOG)的概念,这是行人识别领域最为经典的算法。如果采用传统的二维相机,应用此方法也解决不了2D欺骗性打印人体图像造成的行人误识别问题。而对于这一问题,我们理论上可以采用结构光法、双目视觉等方法解决,但对于结构光法来说,这是一种主动式、侵入式照明,可能会对拍摄的行人造成身体伤害;而对于双目视觉方法增加了硬件设备,需要多个相机和传感器的配合处理,同时也增加了实验成本,经济型也待考虑。所以基于这些限制,我们选取光场相机作为实验设备。
光场相机机身外形与普通传统相机差不多,但内部结构大有不同。传统相机的工作原理是主镜头捕捉光线,聚焦在镜头后的胶片或感光器上,其中所有的光线总和形成相片上的小点,以显示成像。而光场相机最大的结构特点是在主镜头与感光器之间,有一个布满9万个微型镜片的显微镜阵列,每一个微小透镜阵列接收由主镜而来的光线后,尽管只记录了光线的强度信息,但却因其相对于某个微透镜的位置而记录了光线的方向信息,同时将光线资料转换,以数码方式记下。相机内置软件操作已‘扩大光场’,追踪每条光线在不同距离的影像上的落点,经数码重新对焦后,便能拍出完美照片。并且,光场相机可以保持原有相机的大孔径所带来的增加光度、减少拍照时间及起粒的情况,不用牺牲景深及及影像清晰度。总体来说。光场相机有如下几个特点:
(1)先拍照,再对焦。
(2)体积小,速度快。
(3)有广泛的应用前景。
由于光场相机具有上述优点,其在计算机视觉领域中无人驾驶、自动驾驶可能有着巨大的发展潜力与广泛的应用前景,因其具有微透镜阵列的特点,可以记录不同方向的光线信息,从而可以记录场景深度信息。而且其结构并不复杂,仅仅具有一个传感器,同时后期对图像的处理也可以采用LYTRO公司推出的Lytro Desktop软件方法进行处理,可以快速精准的输出不同格式的二维图像或者景深图,并且对场景图像的获取并不会对场景内的人或者物体造成不必要的伤害,是一种友好式的获取。截至到目前为止,还没有应用光场相机去做相关行人识别的研究。
发明内容
本发明目的在于提供了一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,该方法利用光场相机可以获取图像景深图的特点来消除由于2D欺骗性打印人体图像或人物海报造成的误识别,以增强行人的识别能力。
如上构思,本发明的技术方案是:一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:包括如下步骤:
①利用光场相机去拍摄大量行人图像和非行人图像,作为实验的正样本和负样本;
②利用Lytro Desktop软件得到所拍摄图像的原始2D图像和景深图;
③利用HOG+SVM对原始2D图像进行ROI区域提取,判断是否包括行人;
④再次利用HOG+SVM对步骤③中判断为行人的景深图进行识别,判断是否包括欺骗性行人。
上述光场相机采用LYTRO公司生产的第二代Lytro-IIIum相机。
上述原始2D图像进行ROI区域提取采用公用INRIA数据集,使用的正样本是经处理的64*128大小的人体图片,使用的负样本是经处理的64*128大小的非人体图片。
上述原始2D图像进行ROI提取时,SVM分类器是OpenCV自带的CvSVM类。
本发明具有如下的优点和积极效果:
1、本发明基于光场相机和HOG、SVM的2D欺骗性行人识别,可进一步降低传统行人识别方法中对2D欺骗性打印人体图像、人物海报的误识别。
2、本发明首先利用传统HOG+SVM方法对原始2D图像提取行人ROI区域,排除大量非行人样本的干扰,其次,再利用HOG+SVM方法对所提取的ROI区域的景深图进行再识别,可进一步排除打印人体图像、人物海报对行人识别的干扰。
3、本发明行人识别所用到的行人数据集是2D图像和景深图相结合的数据集且是在不同的实验场景下,对不同的人的姿态、高矮、胖瘦,不同的光照下所获取的,具有很强的随机性与适应性,能够满足我们的实验条件。
本发明运用传统的HOG+SVM方法对原始图像提取行人ROI区域,训练所采用正负样本来自公共的INRIA数据集,其数据集图像来自网络和GRAZ 01数据集并且数据集中的图像具有不同的姿态,光照条件,具有广泛的代表性。使用的正负样本是经处理的64*128大小的人体图片。而进行行人再识别时,所应用的数据集是通过我们的Lytro IIIum相机拍摄建立,正负样本为所拍摄图像所对应的景深图。其中通过对原始2D图像进行ROI提取后的正样本为571张,负样本为261张,通过归一化得到的图像大小为128*64(原始图像大小为2022*1404)。
4、本发明在进行原始2D图像ROI提取时,SVM分类器是OpenCV自带的CvSVM类,核函数为线性核函数,其参数少速度快,对于线性可分数据,其分类效果很理想。而进行行人识别时,SVM分类器是Matlab封装实现的,而核函数分别为高斯(RBF)核函数、线性(Linear)核函数和多项式(Polynomial)核函数,其无论大样本还是小样本都有比较好的性能。
5、本发明实验中采用的相机是LYTRO公司生产的第二代Lytro-IIIum相机,而对于原始2D图像和景深图的获取采用的是Lytro Desktop软件,是LYTRO公司公布的一款软件方法。使用Lytro Desktop软件能较快校准的对所拍摄图像进行处理,且可以同时输出原始2D图像和景深图。
6、本发明只需要用到光场相机一个硬件设备,一个传感器就能进行行人识别,实验难度和实验成本低。
附图说明
图1是本发明的工作流程图。
具体实施方式
一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,包括如下步骤:
1、首先利用LYTRO光场相机拍摄大量行人和非行人图像,作为实验的正负样本;
2、利用Lytro Desktop软件得到所拍摄图像的原始2D图像和景深图;
3、利用HOG+SVM方法对原始2D图像进行ROI区域提取,判断是否包括行人,大概率滤除非行人图像;对原始2D图像ROI区域提取采用公用INRIA数据集,使用的正样本是经处理的64*128大小的人体图片,使用的负样本是经处理的64*128大小的非人体图片;
4、在所提取的ROI区域选取一定比例的正负行人景深图样本进行训练,最后得到行人识别SVM模型;
5、再次利用HOG+SVM对步骤3判断为行人的景深图再次进行识别,判断是否包括欺骗性行人,采用的数据库是原始2D图像ROI提取后的行人景深图,正样本571张,负样本261张;
6、取剩余正负行人样本进行测试,得到行人识别的准确率。
本发明利用打印人体图像或人物海报维度是2D的特点获取其景深图,对景深图进行行人识别,去除打印2D欺骗性人体图像和人物海报的影响,提高识别准确率。
需要说明的是,以上所述仅为本发明实施例,仅仅是解释本发明,并非因此限制本发明专利范围。对属于本发明技术构思而仅仅显而易见的改动,同样在本发明保护范围之内。
Claims (4)
1.一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:包括如下步骤:
①利用光场相机去拍摄大量行人图像和非行人图像,作为实验的正样本和负样本;
②利用Lytro Desktop软件得到所拍摄图像的原始2D图像和景深图;
③利用HOG+SVM对原始2D图像进行ROI区域提取,判断是否包括行人;
④再次利用HOG+SVM对步骤③中判断为行人的景深图进行识别,判断是否包括欺骗性行人。
2.根据权利要求1所述的一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:上述光场相机采用LYTRO公司生产的第二代Lytro-Illum相机。
3.根据权利要求1所述的一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:上述原始2D图像进行ROI区域提取采用公用INRIA数据集,使用的正样本是经处理的64*128大小的人体图片,使用的负样本是经处理的64*128大小的非人体图片。
4.根据权利要求1所述的一种基于光场相机和HOG、SVM的2D欺骗性行人识别方法,其特征在于:上述原始2D图像进行ROI提取时,SVM分类器是OpenCV自带的CvSVM类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810985456.6A CN110866420A (zh) | 2018-08-28 | 2018-08-28 | 一种基于光场相机和hog、svm的2d欺骗性行人识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810985456.6A CN110866420A (zh) | 2018-08-28 | 2018-08-28 | 一种基于光场相机和hog、svm的2d欺骗性行人识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110866420A true CN110866420A (zh) | 2020-03-06 |
Family
ID=69651809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810985456.6A Pending CN110866420A (zh) | 2018-08-28 | 2018-08-28 | 一种基于光场相机和hog、svm的2d欺骗性行人识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866420A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021227645A1 (zh) * | 2020-05-14 | 2021-11-18 | 华为技术有限公司 | 目标检测方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324955A (zh) * | 2013-06-14 | 2013-09-25 | 浙江智尔信息技术有限公司 | 一种基于视频处理的行人检测方法 |
CN106682641A (zh) * | 2017-01-05 | 2017-05-17 | 北京细推科技有限公司 | 基于fhog‑lbph特征的图像行人识别方法 |
CN107609475A (zh) * | 2017-08-08 | 2018-01-19 | 天津理工大学 | 基于光场相机的行人检测误检提出方法 |
-
2018
- 2018-08-28 CN CN201810985456.6A patent/CN110866420A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324955A (zh) * | 2013-06-14 | 2013-09-25 | 浙江智尔信息技术有限公司 | 一种基于视频处理的行人检测方法 |
CN106682641A (zh) * | 2017-01-05 | 2017-05-17 | 北京细推科技有限公司 | 基于fhog‑lbph特征的图像行人识别方法 |
CN107609475A (zh) * | 2017-08-08 | 2018-01-19 | 天津理工大学 | 基于光场相机的行人检测误检提出方法 |
Non-Patent Citations (1)
Title |
---|
CHEN JIA: "Identification of Pedestrians From Confused Planar Objects Using Light Field Imaging", 《IEEE》, 13 July 2018 (2018-07-13) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021227645A1 (zh) * | 2020-05-14 | 2021-11-18 | 华为技术有限公司 | 目标检测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Squeezesegv2: Improved model structure and unsupervised domain adaptation for road-object segmentation from a lidar point cloud | |
Feris et al. | Large-scale vehicle detection, indexing, and search in urban surveillance videos | |
CN107609475B (zh) | 基于光场相机的行人检测误检提出方法 | |
CN103530638A (zh) | 多摄像头下的行人匹配方法 | |
Manyam et al. | Two faces are better than one: Face recognition in group photographs | |
CN113408584B (zh) | Rgb-d多模态特征融合3d目标检测方法 | |
CN111967288A (zh) | 智能三维物体识别和定位系统和方法 | |
WO2021217764A1 (zh) | 一种基于偏振成像的人脸活体检测方法 | |
WO2020207172A1 (zh) | 基于三维光场技术的光学无人机监测方法及系统 | |
CN113673584A (zh) | 一种图像检测方法及相关装置 | |
Shi et al. | An improved lightweight deep neural network with knowledge distillation for local feature extraction and visual localization using images and LiDAR point clouds | |
Jia et al. | Identification of pedestrians from confused planar objects using light field imaging | |
CN110866426A (zh) | 基于光场相机和深度学习的行人识别方法 | |
CN113762009B (zh) | 一种基于多尺度特征融合及双注意力机制的人群计数方法 | |
CN110866420A (zh) | 一种基于光场相机和hog、svm的2d欺骗性行人识别方法 | |
Madessa et al. | Leveraging an instance segmentation method for detection of transparent materials | |
CN104166840A (zh) | 一种基于视频会议系统的聚焦实现方法 | |
CN109492513B (zh) | 光场监控的人脸空间去重方法 | |
CN105893979A (zh) | 基于光场成像技术的交通标示智能识别系统及方法 | |
CN110866422A (zh) | 一种基于光场成像结合lbp与svm的二维虚假行人识别方法 | |
CN114998879A (zh) | 一种基于事件相机的模糊车牌识别方法 | |
CN113869151A (zh) | 一种基于特征融合的跨视角步态识别方法及系统 | |
CN110866421A (zh) | 一种基于光场相机与hog、sift混合特征的行人识别方法 | |
Niu et al. | Real-time recognition and location of indoor objects | |
Gattawar et al. | Automatic Number Plate Recognition using YOLO for Indian Conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200306 |
|
RJ01 | Rejection of invention patent application after publication |