CN101799872B - 一种场景图像的全局结构信息特征的提取方法 - Google Patents
一种场景图像的全局结构信息特征的提取方法 Download PDFInfo
- Publication number
- CN101799872B CN101799872B CN2010101444919A CN201010144491A CN101799872B CN 101799872 B CN101799872 B CN 101799872B CN 2010101444919 A CN2010101444919 A CN 2010101444919A CN 201010144491 A CN201010144491 A CN 201010144491A CN 101799872 B CN101799872 B CN 101799872B
- Authority
- CN
- China
- Prior art keywords
- image
- dimension
- steps
- module
- local binary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000000513 principal component analysis Methods 0.000 claims description 19
- 230000004927 fusion Effects 0.000 claims description 13
- 238000013139 quantization Methods 0.000 claims description 9
- 238000011002 quantification Methods 0.000 claims description 8
- 230000007704 transition Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
本发明公开一种场景图像的全局结构信息特征的提取方法,包括步骤如下:读取场景图像并判断是否为彩色图像,若为彩色图像则进行转换得到灰度图像,若为灰度图像则对灰度图像按照三个级别进行划分并得到三个级别划分对应的共31图像块;对图像块中每个像素的结构信息特征进行计算得到一个8维局部二元模式特征;对8维局部二元模式特征进行量化得到并计算1维局部二元模式量化特征的直方图,得到并对255维直方图特征进行主成份分析,得到40维直方图特征;计算8维局部二元模式特征的直方图,得到并将8维直方图特征和40维直方图特征融合,得到31个图像块的对应的48维结构信息特征进行融合,得到一幅图像的全局结构信息特征。
Description
技术领域
本发明属于模式识别与信息处理技术领域,涉及数字图像的自动处理技术,尤其涉及一种场景图像的全局结构信息特征的提取方法。
背景技术
随着数码相机、摄像头、超高速扫描仪等各种图像获取设备的广泛应用以及互联网的迅猛发展,数码图像的数量呈指数级增长,据不完全统计仅2004年就产生了超过180亿的数码图像,而Google Image Search已经索引的图片更是数以亿计,因此如何将图像进行有效的分类变得越来越重要。一个人通常可以识别10,000多个类别的视觉对象,而且识别过程很快,毫不费力,对视角、光亮、遮挡和背景混淆也有很好的鲁棒性,并且识别一种新的类别仅需要很少的监督和少量样本即可。因此,如何使计算机达到人类同等水平的类别识别能力具有重要意义,这也成为计算机视觉领域的一个重要和热点问题之一。场景图像分类的主要目标就是根据图像中包含的场景将图像分为不同的类别,例如卧室、起居室、商店、海岸等。良好的视觉对象分类效果具有广泛的应用前景,可以广泛应用于图像检索、视频分析、辅助驾驶、视频监控等等领域。不同于普通图像的分类问题主要取决于纹理特征的好坏,场景图像的分类则主要取决于全局结构特征的描述性,因此一个区分度良好的全局结构特征的设计是场景图像分类的关键。
针对普通图像提取结构特征的问题,国内外的学者已经提出了很多算法,其中最主要的方法还是基于物体轮廓的方法。一般的做法是先通过边缘检测获得物体的边缘信息,然后通过联通域分析得到感兴趣区域的外围轮廓,最后统计得到的轮廓的位置及大小来代表图像的结构特征。在此基础上,其它学者也提出了一些改进算法,这些改进算法针对图像中多个轮廓会根据他们的相对位置关系通过数学模型如混合高斯模型等对多个轮 廓建立模型并形成模板,进而统计图像的结构特征。这种改进方法通常比只统计简单的轮廓更加准确和有效,但也会增加计算复杂度,在需要实时计算的场合往往不能满足要求。与普通图像不同,场景图像有其自身的固有特点,上述轮廓信息往往不能有效区分场景的类别,至今还很少学者提出专门针对场景图像的全局结构特征,面对场景图像的分类,大多数已提出的方法还是使用局部纹理特征进行分类。
发明内容
本发明的目的旨在提供一种用于场景图像分类的场景图像的全局结构信息特征的提取方法,针对场景图像的特点,按照三个级别对场景图像进行划分并得到三个级别划分对应的共31图像块;对图像块中每个像素的结构信息特征进行计算得到一个8维局部二元模式特征;对8维局部二元模式特征进行量化得到并计算1维局部二元模式量化特征的直方图,得到并对255维直方图特征进行主成份分析,得到40维直方图特征;计算8维局部二元模式特征的直方图,得到并将8维直方图特征和40维直方图特征融合,得到31个图像块的对应的48维结构信息特征进行融合,得到场景图像的全局结构信息特征。利用该特征可以描述场景图像的全局结构信息,从而达到提高场景图像的分类准确率。本发明适用于复杂的场景图像分类,具有一定的通用性和实用性。
为达成上述目的,本发明是提供一种场景图像的全局结构信息特征的提取方法,该提取方法的具体步骤如下:
步骤A1:使用场景图像读取模块读取场景图像,并使用灰度图像判断模块判断该场景图像是否为彩色图像,若为彩色图像则使用灰度图像转换模块将彩色图像进行转换,得到灰度图像,若为灰度图像则执行步骤A2;
步骤A2:使用图像等级划分模块对灰度图像按照三个级别进行划分,得到第一级划分、第二级划分和第三级划分对应的图像块,所述图像块为31个图像块;
步骤A3:使用局部二元模式特征计算模块对图像块中每个像素的结构信息特征进行计算,得到一个8维局部二元模式特征;
步骤A4:使用局部二元模式特征量化模块对8维局部二元模式特征进行量化,得到1维局部二元模式量化特征,并使用直方图计算模块计算1维局部二元模式量化特征的直方图,得到255维直方图特征Hps;使用主成分分析计算模块对255维直方图特征Hps进行主成份分析,得到40维直方图特征Hp;再使用直方图计算模块计算8维局部二元模式特征的直方图,得到8维直方图特征Hb;最后使用直方图特征融合模块将8维直方图特征Hb和40维直方图特征Hp融合,得到一个图像块对应的48维结构信息特征Hf=(Hb,Hp);
步骤A5:使用计数模块判断31个图像块的48维结构信息特征Hf是否全部计算完毕,若没有计算完毕,则重复步骤A3至步骤A4,若全部计算完毕,则执行步骤A6;
步骤A6:使用结构信息特征融合模块对31个图像块的48维结构信息特征Hf进行融合,得到一幅图像的全局结构信息特征Hg=(Hf1,...,Hf31)。
本发明与已有的用于场景图像全局结构特征相比,本发明的方法具有如下特点:本发明不仅计算速度快,而且可以有效的用于场景类别的分类,本发明考虑到现有的全局结构信息特征提取时受噪声影响比较大的情况,在此基础上增加8维的方向直方图特征,在不增加计算量的前提下,同时也会减少噪声的影响,从而提高整个系统的鲁棒性。
附图说明
图1是本发明实施例的系统结构示意图;
图2是本发明实现方案流程图;
图3是本发明对场景图像的三级划分示意图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如图1示出本发明的系统结构示意图,实现本发明的系统结构所需的基本的硬件条件为:一台主频为2.4GHz,内存为1G的计算机;所需软件 条件为:编程环境(Visual C++ 6.0),本发明的系统结构在计算机中实现,包括:场景图像读取模块1、灰度图像判断模块2、灰度图像转换模块3、图像等级划分模块4、局部二元模式特征计算模块5、局部二元模式特征量化模块6、直方图计算模块7、主成分分析计算模块8、直方图特征融合模块9、计数模块10和结构信息特征融合模块11;
场景图像读取模块1读取场景图像;灰度图像判断模块2与场景图像读取模块1连接,灰度图像判断模块2接收场景图像,并判断并输出该场景图像的彩色图像或灰度图像;灰度图像转换模块3与灰度图像判断模块2连接,灰度图像转换模块3接收彩色图像,并将彩色图像转换成灰度图像;图像等级划分模块4分别与灰度图像判断模块2和灰度图像转换模块3连接,图像等级划分模块4对灰度图像按照三个级别进行划分,得到第一级划分、第二级划分和第三级划分为对应31个的图像块;局部二元模式特征计算模块5与图像等级划分模块4连接,局部二元模式特征计算模块5对图像块中每个像素的结构信息特征进行计算,得到一个8维局部二元模式特征;局部二元模式特征量化模块6与局部二元模式特征计算模块5连接,局部二元模式特征量化模块6对8维局部二元模式特征进行量化,得到1维局部二元模式量化特征;直方图计算模块7与局部二元模式特征量化模块6连接,直方图计算模块7计算1维局部二元模式量化特征的直方图,得到255维直方图特征Hps;主成分分析计算模块8与直方图计算模块7连接,主成分分析计算模块8对255维直方图特征Hps进行主成份分析,得到40维直方图特征Hp;再使用直方图计算模块7计算8维局部二元模式特征的直方图,得到8维直方图特征Hb;直方图特征融合模块9与主成分分析计算模块8连接,直方图特征融合模块9将8维直方图特征Hb和40维直方图特征Hp融合,得到一个图像块对应的48维结构信息特征Hf=(Hb,Hp);计数模块10与直方图特征融合模块9连接,计数模块10计算31个图像块的48维结构信息特征Hf,当Hf<31,则输出未计算完毕的图像块到局部二元模式特征计算模块5,Hf=31时,则输出31个图像块的48维结构信息特征Hf;结构信息特征融合模块11与计数模块10连接,结构信息特征融合模块11对31个图像块的48维结构信息特征Hf进行融合,得到一幅图像的全局结构信息特征Hg=(Hf1,...,Hf31)。
如图2示出本发明是提供一种场景图像的全局结构信息特征的提取方法,该提取方法的具体步骤如下:
步骤A1:使用场景图像读取模块1读取场景图像,并使用灰度图像判断模块2判断该场景图像是否为彩色图像,若为彩色图像则使用灰度图像转换模块3将彩色图像进行转换,得到灰度图像,若为灰度图像则执行步骤A2;
步骤A2:使用图像等级划分模块4对灰度图像按照三个级别进行划分,得到第一级划分、第二级划分和第三级划分对应的图像块,所述图像块为31个图像块;
步骤A3:使用局部二元模式特征计算模块5对图像块中每个像素的结构信息特征进行计算,得到一个8维局部二元模式特征;
步骤A4:使用局部二元模式特征量化模块6对8维局部二元模式特征进行量化,得到1维局部二元模式量化特征,并使用直方图计算模块7计算1维局部二元模式量化特征的直方图,得到255维直方图特征Hps;使用主成分分析计算模块8对255维直方图特征Hps进行主成份分析,得到40维直方图特征Hp;再使用直方图计算模块7计算8维局部二元模式特征的直方图,得到8维直方图特征Hb;最后使用直方图特征融合模块9将8维直方图特征Hb和40维直方图特征Hp融合,得到一个图像块对应的48维结构信息特征Hf=(Hb,Hp);
步骤A5:使用计数模块10判断31个图像块的48维结构信息特征Hf是否全部计算完毕,若没有计算完毕,则重复步骤A3至步骤A4,若全部计算完毕,则执行步骤A6;
步骤A6:使用结构信息特征融合模块对31个图像块的48维结构信息特征Hf进行融合,得到一幅图像的全局结构信息特征Hg=(Hf1,...,Hf31)。
其中:第一级划分对应的图像块的具体步骤如下:
步骤A211:首先对于灰度图像按照长宽比进行4×4的均匀划分,得到16个图像块,如图3中第一级划分的实线所示;
步骤A212:将灰度图像的四周各剪切掉1/8后,再对灰度图像按照长宽比进行3×3的均匀划分,得到9个图像块,此时第一级划分共得到25个图像块,如图3中第一级划分的虚线所示。
其中:第二级划分对应的图像块的具体步骤如下:
步骤A221:首先将灰度图像按照原始的长宽比缩小一倍,然后对于缩小后的图像按照长宽比进行2×2的均匀划分,得到4个图像块,如图3中第二级划分的实线所示;
步骤A222:将灰度图像四周各剪切掉1/4后,得到1个图像块,此时第二级划分共得到5个图像块,如图3中第二级划分的虚线所示。
其中:第三级划分对应的图像块的具体步骤如下:将灰度图像按照原始长宽比缩小一倍,得到1个图像块,如图3中第三级划分的实线所示。
其中:获得8维局部二元模式特征的具体步骤如下:
步骤A31:首先定义图像块中像素P0的8邻域像素为Pi,其中i=1~8;
步骤A32:比较像素P0的灰度强度与8邻域像素Pi的灰度强度,若P0>Pi,则记为0,若P0<Pi,则记为1,对每个像素,共得到8维局部二元模式特征Fb表示为:Fb=(fb1,fb2,fb3,fb4,fb5,fb6,fb7,fb8),fbi=0或1,i=1~8。
其中:步骤A4中8维局部二元模式特征量化的具体公式如下:
Fp=fb1×27+fb2×26+fb3×25+fb4×24+fb5×23+fb6×22+fb7×21+fb8,则Fp∈[0,255]。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (1)
1.一种场景图像的全局结构信息特征的提取方法,其特征在于:该提取方法的具体步骤如下:
步骤A1:使用场景图像读取模块读取场景图像,并使用灰度图像判断模块判断该场景图像是否为彩色图像,若为彩色图像则使用灰度图像转换模块将彩色图像进行转换,得到灰度图像,若为灰度图像则执行步骤A2;
步骤A2:使用图像等级划分模块对灰度图像按照三个级别进行划分,得到第一级划分、第二级划分和第三级划分对应的图像块,所述图像块为31个图像块;
步骤A3:使用局部二元模式特征计算模块对图像块中每个像素的结构信息特征进行计算,得到一个8维局部二元模式特征;
步骤A4:使用局部二元模式特征量化模块对8维局部二元模式特征进行量化,得到1维局部二元模式量化特征,并使用直方图计算模块计算1维局部二元模式量化特征的直方图,得到255维直方图特征Hps;使用主成分分析计算模块对255维直方图特征Hps进行主成份分析,得到40维直方图特征Hp;再使用直方图计算模块计算8维局部二元模式特征的直方图,得到8维直方图特征Hb;最后使用直方图特征融合模块将8维直方图特征Hb和40维直方图特征Hp融合,得到一个图像块对应的48维结构信息特征Hf=(Hb,Hp);
步骤A5:使用计数模块判断31个图像块的48维结构信息特征Hf是否全部计算完毕,若没有计算完毕,则重复步骤A3至步骤A4,若全部计算完毕,则执行步骤A6;
步骤A6:使用结构信息特征融合模块对31个图像块的48维结构信息特征Hf进行融合,得到一幅图像的全局结构信息特征Hg=(Hf1,...,Hf31);
所述第一级划分对应的图像块的具体步骤如下:
步骤A21:首先对于灰度图像按照长宽比进行4×4的均匀划分,得到16个图像块;
步骤A21:将灰度图像的四周各剪切掉1/8后,再对灰度图像按照长宽比进行3×3的均匀划分,得到9个图像块,此时第一级划分共得到25个图像块;
所述第二级划分对应的图像块的具体步骤如下:
步骤A21:首先将灰度图像按照原始的长宽比缩小一倍,然后对于缩小后的图像按照长宽比进行2×2的均匀划分,得到4个图像块;
步骤A22:将灰度图像四周各剪切掉1/4后,得到1个图像块,此时第二级划分共得到5个图像块;
所述第三级划分对应的图像块的具体步骤如下:将灰度图像按照原始长宽比缩小一倍,得到1个图像块;
所述获得8维局部二元模式特征的具体步骤如下,
步骤A31:首先定义图像块中像素P0的8邻域像素为Pi,其中i=1~8;
步骤A32:比较像素P0的灰度强度与8邻域像素Pi的灰度强度,若P0>Pi,则记为0,若P0<Pi,则记为1,对每个像素,共得到8维局部二元模式特征Fb表示为:Fb=(fb1,fb2,fb3,fb4,fb5,fb6,fb7,fb8),fbi=0或1,i=1~8。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101444919A CN101799872B (zh) | 2010-04-12 | 2010-04-12 | 一种场景图像的全局结构信息特征的提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101444919A CN101799872B (zh) | 2010-04-12 | 2010-04-12 | 一种场景图像的全局结构信息特征的提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101799872A CN101799872A (zh) | 2010-08-11 |
CN101799872B true CN101799872B (zh) | 2012-04-25 |
Family
ID=42595544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101444919A Expired - Fee Related CN101799872B (zh) | 2010-04-12 | 2010-04-12 | 一种场景图像的全局结构信息特征的提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101799872B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6792746B2 (ja) * | 2017-06-05 | 2020-12-02 | 瀏陽 宋 | 周波数領域のセグメント特徴解析による状態識別法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576952B (zh) * | 2009-03-06 | 2013-10-16 | 北京中星微电子有限公司 | 一种检测静止目标的方法和装置 |
-
2010
- 2010-04-12 CN CN2010101444919A patent/CN101799872B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101799872A (zh) | 2010-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101814147B (zh) | 一种实现场景图像的分类方法 | |
EP2959454B1 (en) | Method, system and software module for foreground extraction | |
US9224211B2 (en) | Method and system for motion detection in an image | |
CN105957356B (zh) | 一种基于行人数量的交通控制系统及方法 | |
KR101906796B1 (ko) | 딥러닝 기반 영상 분석 장치 및 영상 분석 방법 | |
CN112104869B (zh) | 一种视频大数据存储及转码优化系统 | |
US20140056519A1 (en) | Method, apparatus and system for segmenting an image in an image sequence | |
JP7147933B2 (ja) | 水質分析方法 | |
CN110428450A (zh) | 应用于矿井巷道移动巡检图像的尺度自适应目标跟踪方法 | |
CN107452212B (zh) | 路口信号灯控制方法及其系统 | |
CN109961425A (zh) | 一种动态水的水质识别方法 | |
US7403636B2 (en) | Method and apparatus for processing an image | |
CN103049748A (zh) | 行为监测方法及装置 | |
CN108563997B (zh) | 一种建立人脸检测模型、人脸识别的方法和装置 | |
Ye | A robust method for counting people in complex indoor spaces | |
Christodoulou et al. | Advanced statistical and adaptive threshold techniques for moving object detection and segmentation | |
CN101799872B (zh) | 一种场景图像的全局结构信息特征的提取方法 | |
Schreiber et al. | GPU-based non-parametric background subtraction for a practical surveillance system | |
CN103871084B (zh) | 蓝印花布图案识别方法 | |
Subashini | Texture feature extraction of infrared river ice images using second-order spatial statistics | |
CN1299242C (zh) | 用于识别移动目标轮廓的图像处理设备及其方法 | |
Lu et al. | A novel background subtraction method for moving vehicle detection | |
KR101521269B1 (ko) | 영상에서 눈 또는 비를 검출하는 방법 | |
Bharathi et al. | Texture feature extraction of infrared river ice images using second-order spatial statistics | |
Ding et al. | Robust moving object detection under complex background |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120425 |
|
CF01 | Termination of patent right due to non-payment of annual fee |