CN102915449A - 一种照片分类方法 - Google Patents
一种照片分类方法 Download PDFInfo
- Publication number
- CN102915449A CN102915449A CN2012103595240A CN201210359524A CN102915449A CN 102915449 A CN102915449 A CN 102915449A CN 2012103595240 A CN2012103595240 A CN 2012103595240A CN 201210359524 A CN201210359524 A CN 201210359524A CN 102915449 A CN102915449 A CN 102915449A
- Authority
- CN
- China
- Prior art keywords
- photo
- area
- feature
- zone
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
- Studio Devices (AREA)
Abstract
本发明公开了一种照片分类方法,包括训练过程和自动分类过程,训练过程先采用基于功率谱斜度的方法提取样本照片的主题区域,然后提取样本照片的特征,最终利用支持矢量机分类器进行照片美学质量的训练,得到分界面模型;自动分类过程对待识别照片进行先采用基于功率谱斜度的方法提取的主题区域,然后提取的特征,最后使用分界面模型进行识别。本发明实现了以美学作为照片的自动分类的标准,准确率高。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及照片分类方法。
背景技术
目前已有很多的对照片进行自动管理和归档以及图像质量评价的技术和专利发明,如申请号为CN200910130984.4在照片拍摄时利用分析图片构成以获得所述照片的构成的特征,并且计算理想特征值、真实特征值及所述理想特征与所述真实特征值之间的差值,以及根据所述差值产生等级以显示与所述照片的构成相关的质量,以此来对拍摄照片进行指导。申请号为CN200810305013.4的发明提供了一种照片管理方法,用于电子装置的图片管理,首先系统侦测是否与电脑建立了连接通信;如果建立了连接,则搜索存储单元中第一种类型的图片;将该搜索到的第一种类型的图片备份到电脑并将该已备份的图片从存储单元中删除;搜索电脑中第二种类型的图片;并将该搜索到的电脑中的第二种类型的图片下载到存储单元中。通过发明的电子装置及图片管理方法,可自动将其中长期未浏览的图片备份到电脑中后从该电子装置中删除,并自动下载电脑中最近浏览次数超过一个预定值的照片到电子装置中。此方法可以非常方便的管理在电子装置中的照片,但是他们并没有涉及照片的美学特点的特征对照片进行选择。
发明内容
为了克服现有技术的上述缺点与不足,本发明的目的在于提供一种照片分类方法,自动保留质量高的照片并且剔除质量低劣的照片,准确率高。
本发明的目的通过以下技术方案实现:一种照片分类方法,包括以下步骤:
S1训练过程:
S1.1采集用于训练的样本照片,由用户将样本照片分成正样本和负样本;
S1.2对样本照片进行主题区域提取;
所述主题区域提取具体包括以下步骤:
S1.2.1将照片从RGB色彩空间转换成灰度色彩空间;
S1.2.2对转换后的照片进行分块处理后,对每一个块计算功率谱斜度S1(x);
S1.2.3使用阈值T1对S1(x)进行二值化处理:将S1(x)与阈值T1比较,S1(x)≥T1的区域为清楚区域;S1(x)<T1的区域为模糊区域;其中T1由用户根据需要确定;
S1.2.4对步骤S1.2.3得到的清楚区域进行最大联通区域检测,确定照片的主题区域,除主题区域外的图像区域定义为背景区域;
S1.3对样本照片的主题区域,背景区域以及全局区域的特征进行提取,得到主题区域特征、背景区域特征和全局区域特征;
S1.4采用支持向量机对正样本的特征和负样本的特征进行训练,建立支持向量机分类器的正样本和负样本特征空间上的分界面模型;
S2自动分类过程:
S2.1对待识别照片进行主题区域提取:
S2.2对待识别照片的主题区域,背景区域以及全局区域的进行特征提取;
S2.3使用步骤S1.4得到的分界面模型对步骤S2.2得到的特征进行分类,保留分类器分类为正类的分类图像结果,删除分类器分类为负类的分类图像结果。
所述主题区域特征包括主题区域HSV直方图和主题区域的大小。
所述背景区域特征为背景区域HSV直方图。
所述全局区域特征包括中心区域内功率谱斜度图的直方图、中心区域内的功率谱斜度图的平均值、中心区域内清晰像素点个数、非中心区域的功率谱斜度图平均值、非中心区域内清晰像素点个数、整张照片的功率谱斜度图的平均值、整张照片的HSV直方图、整张照片的对比度;
所述中心区域及非中心区域的定义为:将照片在水平和垂直方向上都等分成三份,得到九个区域,其中位于照片中心的区域为中心区域,其余八个区域为非中心区域。
步骤S2.3所述使用步骤S1.4得到的分界面模型对步骤S2.2得到的特征进行分类,具体为:
使用C-SVC类型的支持向量机对步骤S2.2得到的特征进行分类,损失函数cost为1.0,允许的终止判据eps为0.001,使用的RBF核函数表达式如下:
exp(-gamma×|u-v|2)
其中比例系数gamma=0.5,u,v为支持向量机的两个特征矢量。
所述对每一个块计算功率谱斜度S1(x),具体为:
首先计算块内像素的对比度
l(x)=(b+kx)γ
其中b=0.7656,k=0.0364,γ=2.2,x表示当前像素的亮度值;
如果当前块内的所有像素对比度的最大值与最小值之差小于阈值T2,且当前块内像素对比度l(x)的均值μ1(x)小于阈值T3,则设定当前块的对比度为0,否则设定块的对比度为1;
对于已设定对比度为1的块,计算其二维傅里叶变换yx(f,θ),其中f表示频率,而θ表示方向,计算公式如下:
f=[(u/(m/2))2+(v/(m/2))2]0.5
θ=arctan(v/u)
u∈[-m/2,m/2]
v∈[-m/2,m/2]
其中m=32表示块的大小,u、v分别表示当前像素点的横纵坐标值;
然后,对相同的频率不同方向上的yx(f,θ)进行求和,计算公式如下:
其中zx(f)表示频率为f、所有方向上的二维傅里叶变换的和;
最后,log(zx(f))和log(f)进行线性拟合,得到拟合直线的斜率αx;利用拟合直线的斜率计算功率谱斜度,计算公式如下:
其中τ1=-3、τ2=2;
而对于对比度为0的情况,设定S1(x)=0。
与现有技术相比,本发明具有以下优点和有益效果:
(1)本发明采用主题区域HSV直方图和主题区域的大小、主题区域HSV直方图、中心区域内功率谱斜度图的直方图、中心区域内的功率谱斜度图的平均值、照片上除中心区域内以外的区域的功率谱斜度图平均值、清楚区域的大小、整张照片的功率谱斜度图的平均值、整张照片的HSV直方图、整张照片的对比度和块内的清晰像素点的个数作为特征,对照片进行识别,实现了以美学作为照片的自动分类的标准,满足了许多追求照片美观的潜在使用者的需求,并且易于实现。
(2)本发明在美学评价方面不仅考虑了全局区域的特征,并且还利用功率谱斜度这种方法对照片的模糊区域提取,设计了区域特征,这些特征更符合人们对于照片美学评价的主观体验。
(3)本发明选用了支持矢量机分类器,在统计误差上和推广能力上进行了有效折中,所以在少量训练样本的情况下,分类器依然可以保持很好的识别性能。
(4)本发明采用基于功率谱斜度的方法提取照片的主题区域,由于功率谱斜度提取照片主题区域的准确性高,本发明的分类方法区别度好。
附图说明
图1为本发明的照片分类方法的流程图。
图2为本发明的照片分类方法计算功率谱斜度的流程图。
图3为本发明的照片分类方法对S1(x)进行二值化处理的流程图。
具体实施方式
下面结合实施例及附图,对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例
如图1所示,本发明的照片分类方法,包括以下步骤:
S1训练过程:
S1.1采集用于训练的样本照片:
从专业的摄影网站flickr上下载照片,根据内容将这些照片分为十个类别,分别为动物、植物、人物、静态、建筑、山水、夜景、雨景、机械和城市;并且根据清晰度和美学将照片分成正样本和负样本;
S1.2对样本照片进行主题区域提取;
所述主题区域提取具体包括以下步骤:
S1.2.1将照片从RGB色彩空间转换成灰度色彩空间,计算公式如下:
Y=0.2989R+0.5870G+0.1140B
其中Y表示灰度值,而R,G,B分别是当前像素点的彩色图像的各个通道值;
S1.2.2对转换后的照片进行分块处理后,对每一个块计算功率谱斜度S1(x);
其中分块处理过程如下:用一个窗口大小为32×32,并且窗口之间存在24个像素点的重叠的汉明窗对照片进行分块处理,第k个汉明窗的表达式如下:
其中m=32,k表示窗口的第k个值;
如图2所示,功率谱斜度S1(x)的计算过程如下:
首先计算块内像素的对比度
l(x)=(b+kx)γ
其中b=0.7656,k=0.0364,γ=2.2,x表示当前像素的亮度值;
如果当前块内的所有像素对比度的最大值与最小值之差小于阈值T2(max(l(x))-min(l(x))≤T2),且当前块内像素对比度l(x)的均值μ1(x)小于阈值T3(μ1(x)≤T3),则设定当前块的对比度为0,否则设定块的对比度为1;其中T2=5,T3=2;
对于已设定对比度为1的块计算其二维傅里叶变换yx(f,θ),其中f表示频率,而θ表示方向,计算公式如下:
f=[(u/(m/2))2+(v/(m/2))2]0.5
θ=arctan(v/u)
u∈[-m/2,m/2]
v∈[-m/2,m/2]
其中m=32表示块的大小,u、v分别表示当前像素点的横纵坐标值;
然后,对相同的频率不同方向上的yx(f,θ)进行求和,计算公式如下:
其中zx(f)表示频率为f、所有方向上的二维傅里叶变换的和;
最后,log(zx(f))和log(f)进行线性拟合,得到拟合直线的斜率αx;利用拟合直线的斜率计算功率谱斜度,计算公式如下:
其中τ1=-3、τ2=2;
而对于对比度为0的情况,设定S1(x)=0。
S1.2.3使用阈值T1对S1(x)进行二值化处理:如图3所示,将S1(x)与阈值T1比较,S1(x)≥T1的区域为清楚区域;S1(x)<T1的区域为模糊区域;其中T1=0.5;
S1.2.4对步骤S1.2.3得到的清楚区域进行最大联通区域检测,确定样本照片的主题区域;
(1)主题区域特征
主题区域特征包括主题区域HSV直方图和主题区域的大小;
主题区域HSV直方图由以下过程得到:对提取的主题区域计算48维的HSV颜色直方图特征,对H(Hue色调),S(Saturation饱和度),V(Value亮度)分别进行16维的直方图统计;
主题区域的大小由以下过程得到:计算主题区域的像素点的个数总数;
(2)背景区域特征
背景区域是指主题区域除外的区域,其特征为背景区域HSV直方图,通过以下过程获得:对非主题区域计算48维的HSV颜色直方图特征,对H(Hue色调),S(Saturation饱和度),V(Value亮度)分别进行16维的直方图统计;
(3)全局区域
全局区域包括中心区域内功率谱斜度图的直方图、中心区域内的功率谱斜度图的平均值、中心区域内清晰像素点个数、非中心区域的功率谱斜度图平均值、非中心区域内清晰像素点个数、整张照片的功率谱斜度图的平均值、整张照片的HSV直方图;
所述中心区域及非中心区域的定义为:将照片在水平和垂直方向上都等分成三份,得到九个区域,其中位于照片中心的区域为中心区域,其余八个区域为非中心区域。
其中,整张照片的对比度由以下公式计算:
Imax和Imin分别表示整张照片的最大亮度值和最小亮度值。
S1.3对样本照片的主题区域,背景区域以及全局区域的进行特征提取,得到主题区域特征、背景区域特征和全局区域特征;
S1.4采用支持向量机对正样本的特征和负样本的特征进行训练,建立支持向量机分类器的正和负样本特征空间上的分界面模型,具体为:
使用C-SVC类型的支持向量机对对步骤S2.2得到特征进行分类,损失函数cost为1.0,允许的终止判据eps为0.001,使用的RBF核函数表达式如下:
exp(-gamma×|u-v|2)
其中比例系数gamma=0.5,u,v为支持向量机的两个特征矢量。
S2自动分类过程:
S2.1对待识别照片进行主题区域提取;
S2.3对待识别照片的主题区域,背景区域以及全局区域的进行特征提取;
S2.3使用步骤S1.4得到的分界面模型对步骤S2.2得到的特征进行分类,保留分类器分类为正类的分类图像结果,删除分类器分类为负类的分类图像结果。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.一种照片分类方法,其特征在于,包括以下步骤:
S1训练过程:
S1.1采集用于训练的样本照片,由用户将样本照片分成正样本和负样本;
S1.2对样本照片进行主题区域提取;
所述主题区域提取具体包括以下步骤:
S1.2.1将照片从RGB色彩空间转换成灰度色彩空间;
S1.2.2对转换后的照片进行分块处理后,对每一个块计算功率谱斜度S1(x);
S1.2.3使用阈值T1对S1(x)进行二值化处理:将S1(x)与阈值T1比较,S1(x)≥T1的区域为清楚区域;S1(x)<T1的区域为模糊区域;其中T1由用户根据需要确定;
S1.2.4对步骤S1.2.3得到的清楚区域进行最大联通区域检测,确定照片的主题区域,除主题区域外的图像区域定义为背景区域;
S1.3对样本照片的主题区域,背景区域以及全局区域的特征进行提取,得到主题区域特征、背景区域特征和全局区域特征;
S1.4采用支持向量机对正样本的特征和负样本的特征进行训练,建立支持向量机分类器的正样本和负样本特征空间上的分界面模型;
S2自动分类过程:
S2.1对待识别照片进行主题区域提取:
S2.2对待识别照片的主题区域,背景区域以及全局区域的进行特征提取;
S2.3使用步骤S1.4得到的分界面模型对步骤S2.2得到的特征进行分类,保留分类器分类为正类的分类图像结果,删除分类器分类为负类的分类图像结果。
2.根据权利要求1所述的照片分类方法,其特征在于,所述主题区域特征包括主题区域HSV直方图和主题区域的大小。
3.根据权利要求1所述的照片分类方法,其特征在于,所述背景区域特征为背景区域HSV直方图。
4.根据权利要求1所述的照片分类方法,其特征在于,所述全局区域特征包括中心区域内功率谱斜度图的直方图、中心区域内的功率谱斜度图的平均值、中心区域内清晰像素点个数、非中心区域的功率谱斜度图平均值、非中心区域内清晰像素点个数、整张照片的功率谱斜度图的平均值、整张照片的HSV直方图、整张照片的对比度;
所述中心区域及非中心区域的定义为:将照片在水平和垂直方向上都等分成三份,得到九个区域,其中位于照片中心的区域为中心区域,其余八个区域为非中心区域。
5.根据权利要求1所述的照片分类方法,其特征在于,步骤S2.3所述使用步骤S1.4得到的分界面模型对步骤S2.2得到的特征进行分类,具体为:
使用C-SVC类型的支持向量机对步骤S2.2得到的特征进行分类,损失函数cost为1.0,允许的终止判据eps为0.001,使用的RBF核函数表达式如下:
exp(-gamma×|u-v|2)
其中比例系数gamma=0.5,u,v为支持向量机的两个特征矢量。
6.根据权利要求1所述的照片分类方法,其特征在于,所述对每一个块计算功率谱斜度S1(x),具体为:
首先计算块内像素的对比度
l(x)=(b+kx)γ
其中b=0.7656,k=0.0364,γ=2.2,x表示当前像素的亮度值;
如果当前块内的所有像素对比度的最大值与最小值之差小于阈值T2,且当前块内像素对比度l(x)的均值μ1(x)小于阈值T3,则设定当前块的对比度为0,否则设定块的对比度为1;
对于已设定对比度为1的块,计算其二维傅里叶变换yx(f,θ),其中f表示频率,而θ表示方向,计算公式如下:
f=[(u/(m/2))2+(v/(m/2))2]0.5
θ=arctan(v/u)
u∈[-m/2,m/2]
v∈[-m/2,m/2]
其中m=32表示块的大小,u、v分别表示当前像素点的横纵坐标值;
然后,对相同的频率不同方向上的yx(f,θ)进行求和,计算公式如下:
其中zx(f)表示频率为f、所有方向上的二维傅里叶变换的和;
最后,log(zx(f))和log(f)进行线性拟合,得到拟合直线的斜率αx;利用拟合直线的斜率计算功率谱斜度,计算公式如下:
其中τ1=-3、τ2=2;
对于对比度为0的情况,设定S1(x)=0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210359524.0A CN102915449B (zh) | 2012-09-24 | 2012-09-24 | 一种照片分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210359524.0A CN102915449B (zh) | 2012-09-24 | 2012-09-24 | 一种照片分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102915449A true CN102915449A (zh) | 2013-02-06 |
CN102915449B CN102915449B (zh) | 2016-05-04 |
Family
ID=47613809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210359524.0A Expired - Fee Related CN102915449B (zh) | 2012-09-24 | 2012-09-24 | 一种照片分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102915449B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218619A (zh) * | 2013-03-15 | 2013-07-24 | 华南理工大学 | 一种图像美学评价方法 |
CN104408061A (zh) * | 2014-10-29 | 2015-03-11 | 深圳市中兴移动通信有限公司 | 相册管理方法和装置 |
CN105357411A (zh) * | 2015-10-29 | 2016-02-24 | 小米科技有限责任公司 | 检测图像质量的方法及装置 |
CN106372661A (zh) * | 2016-08-30 | 2017-02-01 | 北京小米移动软件有限公司 | 构建分类模型的方法及装置 |
CN106372663A (zh) * | 2016-08-30 | 2017-02-01 | 北京小米移动软件有限公司 | 构建分类模型的方法及装置 |
CN107491766A (zh) * | 2017-08-31 | 2017-12-19 | 四川长虹电器股份有限公司 | 基于图像识别的照片分类方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1987893A (zh) * | 2006-10-27 | 2007-06-27 | 东华大学 | 一种面向摄像整纬器的织物纹理图像识别方法 |
US20070297683A1 (en) * | 2006-06-26 | 2007-12-27 | Eastman Kodak Company | Classifying image regions based on picture location |
CN102509109A (zh) * | 2011-10-20 | 2012-06-20 | 西北民族大学 | 一种唐卡图像与非唐卡图像的区分方法 |
-
2012
- 2012-09-24 CN CN201210359524.0A patent/CN102915449B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070297683A1 (en) * | 2006-06-26 | 2007-12-27 | Eastman Kodak Company | Classifying image regions based on picture location |
CN1987893A (zh) * | 2006-10-27 | 2007-06-27 | 东华大学 | 一种面向摄像整纬器的织物纹理图像识别方法 |
CN102509109A (zh) * | 2011-10-20 | 2012-06-20 | 西北民族大学 | 一种唐卡图像与非唐卡图像的区分方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218619A (zh) * | 2013-03-15 | 2013-07-24 | 华南理工大学 | 一种图像美学评价方法 |
CN104408061A (zh) * | 2014-10-29 | 2015-03-11 | 深圳市中兴移动通信有限公司 | 相册管理方法和装置 |
WO2016065999A1 (zh) * | 2014-10-29 | 2016-05-06 | 努比亚技术有限公司 | 相册管理方法和装置 |
CN105357411A (zh) * | 2015-10-29 | 2016-02-24 | 小米科技有限责任公司 | 检测图像质量的方法及装置 |
CN105357411B (zh) * | 2015-10-29 | 2018-07-31 | 小米科技有限责任公司 | 检测图像质量的方法及装置 |
CN106372661A (zh) * | 2016-08-30 | 2017-02-01 | 北京小米移动软件有限公司 | 构建分类模型的方法及装置 |
CN106372663A (zh) * | 2016-08-30 | 2017-02-01 | 北京小米移动软件有限公司 | 构建分类模型的方法及装置 |
CN106372663B (zh) * | 2016-08-30 | 2019-09-10 | 北京小米移动软件有限公司 | 构建分类模型的方法及装置 |
CN107491766A (zh) * | 2017-08-31 | 2017-12-19 | 四川长虹电器股份有限公司 | 基于图像识别的照片分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102915449B (zh) | 2016-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10198657B2 (en) | All-weather thermal-image pedestrian detection method | |
US11830230B2 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN110909690B (zh) | 一种基于区域生成的遮挡人脸图像检测方法 | |
US8750573B2 (en) | Hand gesture detection | |
CN103020992B (zh) | 一种基于运动颜色关联的视频图像显著性检测方法 | |
CN102867188B (zh) | 一种基于级联结构的会场内座位状态检测方法 | |
CN102915449A (zh) | 一种照片分类方法 | |
US20120027252A1 (en) | Hand gesture detection | |
CN106156712A (zh) | 一种基于自然场景下的身份证号码识别方法与装置 | |
CN107886507B (zh) | 一种基于图像背景和空间位置的显著区域检测方法 | |
CN106250877A (zh) | 近红外人脸识别方法及装置 | |
CN110728277B (zh) | 一种印章智能检测与识别的方法及系统 | |
CN102110225B (zh) | 户外人脸识别方法及系统 | |
CN111582092B (zh) | 一种基于人体骨架的行人异常行为检测方法 | |
US8290277B2 (en) | Method and apparatus for setting a lip region for lip reading | |
CN102968637A (zh) | 一种复杂背景图像文字分割方法 | |
CN105760858A (zh) | 一种基于类Haar中间层滤波特征的行人检测方法及装置 | |
CN108764096B (zh) | 一种行人重识别系统和方法 | |
CN105631039A (zh) | 一种图片浏览方法 | |
CN104143091B (zh) | 基于改进mLBP的单样本人脸识别方法 | |
CN102542246A (zh) | Atm机异常人脸检测方法 | |
CN103218604A (zh) | 交通场景中基于路面提取的行人检测方法 | |
CN104008404B (zh) | 一种基于显著直方图特征的行人检测方法及系统 | |
CN104318266A (zh) | 一种图像智能分析处理预警方法 | |
CN107273810A (zh) | 一种自动学习划定人脸检测兴趣区域的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160504 Termination date: 20160924 |
|
CF01 | Termination of patent right due to non-payment of annual fee |