CN101556652A - 一种基于机器学习的中国书画颜色分层分析方法 - Google Patents

一种基于机器学习的中国书画颜色分层分析方法 Download PDF

Info

Publication number
CN101556652A
CN101556652A CNA2009100823722A CN200910082372A CN101556652A CN 101556652 A CN101556652 A CN 101556652A CN A2009100823722 A CNA2009100823722 A CN A2009100823722A CN 200910082372 A CN200910082372 A CN 200910082372A CN 101556652 A CN101556652 A CN 101556652A
Authority
CN
China
Prior art keywords
color
calligraphy
image
painting
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009100823722A
Other languages
English (en)
Other versions
CN101556652B (zh
Inventor
娄海涛
胡正坤
鲍泓
王迪菲
王真真
张南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Union University
Original Assignee
Beijing Union University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Union University filed Critical Beijing Union University
Priority to CN2009100823722A priority Critical patent/CN101556652B/zh
Publication of CN101556652A publication Critical patent/CN101556652A/zh
Application granted granted Critical
Publication of CN101556652B publication Critical patent/CN101556652B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于机器学习的中国书画颜色分层分析方法,其特征在于:对同类图像样本进行像素级别的颜色分类,建立一组关于颜色集的先验知识;利用所述先验知识对图像进行基于所述颜色集的分层;将图像中包含的语义信息,以各图像区域为载体,层析到各所述颜色层上;实现所述图像的各要素的分割提取;其步骤包括:1)获取数字图像的颜色先验知识;2)用机器学习方法建立颜色分层的原始颜色描述模型;3)对所述原始颜色描述模型进行反馈学习,得到颜色描述模型;4)利用所述颜色描述模型,对输入的书画数字图像进行颜色分层。本发明的方法为实现中国书画作品的各要素的分割提取,如技法、分类、构图、主题,甚至意境等中、高层语义的研究奠定了基础。

Description

一种基于机器学习的中国书画颜色分层分析方法
技术领域
本发明涉及一种模式分析领域,特别是关于一种基于机器学习的中国书画颜色分层分析方法。
背景技术
中国书画作品是中国文化中的重要组成部分,具有独特的艺术创作形式,在世界美术领域中自成体系,独树一帜。20世纪90年代以来,随着计算机技术和图像处理技术的迅速发展,中国书画作品的数字图像获得广泛应用,因此对中国书画作品数字图像的处理和使用受到越来越广泛的关注。
目前对图像的研究主要集中在自然图像领域,且技术相对成熟。其主要研究领域包括基于图像语义的标注和分类,图像分割,图像识别与检索等。这些研究主要是利用图像的全局特征,但考虑到中国书画作品采用“散点透视”的构图方法,且大多使用毛笔作画,具有“以形写神”、“随类赋彩”的艺术特点,即通过色块能表现出图像的结构特征。因此使用对自然图像的全局分析处理方法处理中国书画,其效果受到了一定的限制。
机器学习是研究计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,主要使用归纳、综合的方法。其主要算法包括决策树算法,随机森林算法,人工神经网络(ArtificialNeural Networks-ANN),SVM(支持向量机)算法,贝叶斯学习算法等。近年来,国内外对有关机器学习的研究和应用取得了长足发展,在国内如泛化能力的研究;监督学习算法向多示例学习算法转化一般准则的研究;在工作流模型设定中的应用;在数据挖掘中的商业应用;基于机器学习的入侵检测技术;人工智能原理在人类学习中的应用等。国外如搜索引擎;PAL计划;汽车自动驾驶;对天文物体的分类等。
在与颜色有关的书画数字图像处理领域,Tang Li于2006年发表的论文“Developing a Shape-and-Composition CBIR Thesaurus for the Traditional ChineseLandscape”中提出的利用中国山水画颜色图表对中国书画中CBIR的应用进行改进。2007年姜磊,钱谦等在论文“中国国画计算机色彩还原系统的研究”中提出的利用国画常用颜色谱在HSV色彩空间上建立国画色彩还原模型。
目前,在中国书画数字图像领域的研究,主要集中在中国书画的色彩还原,山水画布局构图的分析以及书画的分类等方面,而利用机器学习实现的中国书画颜色分层分析方面的研究尚无人涉足。
发明内容
针对上述问题,本发明的目的是提供一种基于机器学习的中国书画颜色分层分析方法。
为实现上述目的,本发明采取以下技术方案:一种基于机器学习的中国书画颜色分层分析方法,其特征在于:对同类图像样本进行像素级别的颜色分类,建立一组关于颜色集的先验知识;利用所述先验知识对图像进行基于所述颜色集的分层;将图像中包含的语义信息,以各图像区域为载体,层析到各所述颜色层上;实现所述图像的各要素的分割提取;其步骤包括:1)获取数字图像的颜色先验知识;2)用机器学习方法建立颜色分层的原始颜色描述模型;3)对所述原始颜色描述模型进行反馈学习,得到颜色描述模型;4)利用所述颜色描述模型,对输入的书画数字图像进行颜色分层。
所述步骤1)分为:a)利用HSV颜色空间的饱和度描述非彩色颜色集;b)利用CIE Lab颜色空间描述彩色颜色集。
所述步骤2)分为:c)利用所述先验知识建立训练样本集;d)基于机器学习方法设计原始颜色描述模型;e)训练所述原始颜色描述模型。
所述步骤3)分为:f)对数字图像进行基于先验知识的聚类分析;g)利用所述聚类分析的数据结果,对所述原始颜色描述模型进行反馈学习。
所述步骤c)中,对于所述非彩色颜色集,先从HSV颜色空间中选取样本数据,再借助RGB颜色空间转换到CIE Lab颜色空间,之后用极坐标(C*,hab)表示a、b分量;对于所述彩色颜色集,在CIE Lab颜色空间直接用极坐标(C*,hab)表示a、b分量。
本发明由于采取以上技术方案,其具有以下优点:1、本发明提供了一种能够将整幅书画作品或书画作品局部图像准确地按颜色分层分割的基于机器学习的中国书画颜色分层分析方法,可以实现半监督的反馈学习,从而不断改进优化模型;通过该模型对书画数字图像进行分层描述,符合中国书画的构图特点,相对全局的特征描述子,能更有效的提取书画作品中,包括技法、用色、构图等的高层语义特征。2、本发明提供了一个基于一般书画作品的先验知识建立的原模型,可以利用这种设计思路,进一步结合各类书画作品,逐渐完善颜色分类和颜色集的范围设置,其颜色种类可以根据书画作品的种类进行调整,为书画作品的分类和高层语义的标注奠定了基础。3、本发明通过对书画图像进行分层,可以将图像中包含的色彩、结构,甚至绘画技法等语义信息,以各图像区域为载体,层析到各颜色层上,因此在特定色层上包含同质语义信息的图像区域相对集中,这使得运用传统的图像处理和分析方法即可提取和研究这些特征信息,因此较之现有的书画图像分析方法更加简单。本发明的方法为实现中国书画作品的各要素的分割提取,如技法、分类、构图、主题,甚至意境等中、高层语义的研究奠定了基础;为书画作品的图像检索、分类和自动语义标注等提供了一种全新的研究思路。
附图说明
图1是本发明的流程示意图
图2是本发明的三层BP神经网络的结构图
图3是本发明的分层处理前的样本图像
图4是本发明基于先验知识分割后的红色色层的二值图像
图5是本发明基于先验知识分割后的黄色色层的二值图像
图6是本发明基于先验知识分割后的蓝色色层的二值图像
图7是本发明基于先验知识分割后的绿色色层的二值图像
图8是本发明基于先验知识分割后的白色色层的二值图像
图9是本发明基于先验知识分割后的黑色色层的二值图像
图10是本发明基于先验知识分割后的杂色色层的二值图像
图11是本发明基于先验知识分割后的红色色层图像
图12是本发明基于先验知识分割后的黄色色层图像
图13是本发明基于先验知识分割后的蓝色色层图像
图14是本发明基于先验知识分割后的绿色色层图像
图15是本发明基于先验知识分割后的白色色层图像
图16是本发明基于先验知识分割后的黑色色层图像
图17是本发明基于先验知识分割后的杂色色层图像
图18是本发明聚类分割后的红色色层图像
图19是本发明聚类分割后的黄色色层图像
图20是本发明聚类分割后的蓝色色层图像
图21是本发明聚类分割后的绿色色层图像
图22是本发明选取的图像基于书画颜色模型分层分割前的效果
图23是本发明选取的图像基于书画颜色模型分层分割后红色分层的二值图
图24是本发明选取的图像基于书画颜色模型分层分割后黄色分层的二值图
图25是本发明选取的图像基于书画颜色模型分层分割后蓝色分层的二值图
图26是本发明选取的图像基于书画颜色模型分层分割后绿色分层的二值图
图27是本发明选取的图像基于书画颜色模型分层分割后白色分层的二值图
图28是本发明选取的图像基于书画颜色模型分层分割后黑色分层的二值图
图29是本发明选取的图像基于书画颜色模型分层分割后杂色分层的二值图
图30是本发明选取的图像基于书画颜色模型分层分割后红色分层图像
图31是本发明选取的图像基于书画颜色模型分层分割后黄色分层图像
图32是本发明选取的图像基于书画颜色模型分层分割后蓝色分层图像
图33是本发明选取的图像基于书画颜色模型分层分割后绿色分层图像
图34是本发明选取的图像基于书画颜色模型分层分割后白色分层图像
图35是本发明选取的图像基于书画颜色模型分层分割后黑色分层图像
图36是本发明选取的图像基于书画颜色模型分层分割后杂色分层图像
图37是本发明选取的一幅花鸟画数字图像
图38是本发明选取的图像基于先验知识分层分割后红色分层图像
图39是本发明选取的图像基于先验知识分层分割后黄色分层图像
图40是本发明选取的图像基于先验知识分层分割后蓝色分层图像
图41是本发明选取的图像基于先验知识分层分割后绿色分层图像
图42是本发明选取的图像基于先验知识分层分割后白色分层图像
图43是本发明选取的图像基于先验知识分层分割后黑色分层图像
图44是本发明选取的图像基于先验知识分层分割后杂色分层图像
图45是本发明选取的图像基于书画颜色模型分层分割后红色分层图像
图46是本发明选取的图像基于书画颜色模型分层分割后黄色分层图像
图47是本发明选取的图像基于书画颜色模型分层分割后蓝色分层图像
图48是本发明选取的图像基于书画颜色模型分层分割后绿色分层图像
图49是本发明选取的图像基于书画颜色模型分层分割后白色分层图像
图50是本发明选取的图像基于书画颜色模型分层分割后黑色分层图像
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
目前对于书画数字图像处理领域主要是借助了自然图像处理领域的相关研究方法和思路。对于中国书画数字图像的特征描述子的提取,目前主要集中于图像的全局特征描述,而缺少同质区域粒度级别的视觉特征描述信息。但由于中国书画的绘画技法、构图、用色等的相似性,以及文化历史的传承等因素,使得全局特征的应用受到了一定的限制。而从人眼视觉感知的分析角度出发,区域级别的描述信息可以较好地区分中国书画主体与相应的题跋、印章等语义区域。利用这种语义区域的划分又可以提取更加具有判别力的信息——如印章,辅助中国书画数字图像的语义分类。于是,提取具有高语义概念区分能力的低层视觉特征成为提高中国书画作品数字图像自动分类和标注性能的关键所在。现有的视觉信息处理领域中众多研究成果表明,颜色是描述图像内容的重要特征,在各种图像特征的对比分析中,颜色对于图像分类及标注也是最为有效的一种特征描述,在基于内容的图像检索技术中得到了广泛的应用。因此,建立利用颜色分层描述的模型对于构建区域级的图像特征描述具有重要的研究意义。
在几大类低层视觉特征中,颜色特征占有重要的地位,因为颜色特征具有直观,区分度强等特性,因此在描述中国书画数字图像的语义概念时,颜色特征起到关键作用。而中国书画作品的颜色是有限的,且发展的趋势从“有色走向无色”的。据王绎在《写像秘诀》“采绘章”中记载,唐朝时期颜料的品种达七十二种之多,而到元朝时中国画的颜料就只剩三十多种,而到了二十世纪六七十年代,中国画中常使用的颜色就只有十多种。基于颜色的有限性,可以考虑通过对一定数量的样本书画数字图像进行分析,寻找中国书画作品的基本颜色分类,构造颜色分层的先验性知识。对一幅书画数字图像进行分层。
为便于分类研究,本发明首先将中国书画的色彩大致分为六类,即红色类,绿色类,蓝色类,黄色类,白色类和黑色类,作为机器学习(Machine Learning)的先验知识,其中白色类中包括浅色和纯白色。之后根据颜色先验知识建立基于机器学习的原始颜色描述模型,对书画数字图像进行基于先验知识的聚类分析,利用聚类分析提供的数据,进行学习反馈。通过不断改进原始颜色描述模型,进而得到不断完善的基于机器学习的中国书画颜色分层的颜色描述模型,实现对中国书画数字图像中包含的颜色信息进行精确的分层。
本发明利用统计学的方法,结合CIE Lab颜色空间和HSV颜色空间的分布以及中国书画色彩运用和颜料使用演进的调查分析,通过对836幅不同时期、不同类型的中国书画作品进行统计分析,将中国书画作品的颜色分成如下六个颜色集:红色颜色集,主要为书画作品的印章以及红色颜料所绘对象,如鸟嘴、红花等。绿色颜色集,主要为书画作品中绿颜色对象,如树叶等。蓝色颜色集,主要为书画作品中蓝颜色的对象,如羽毛等。黄色颜色集,主要为书画作品中黄颜色的对象,如石山等。白色颜色集,主要为书画作品的浅色背景,如花鸟画和山水画的浅色背景、留白等。黑色颜色集,主要为书画作品的书法、题跋、水墨对象以及水墨勾画的对象轮廓等。也可以根据不同的书画种类,如花鸟、人物或工笔和写意等重新划分,且颜色集的数目也不一定为6。
本发明方法的总体思路如下:
首先,基于一定数量的同类书画数字图像样本进行像素级别的颜色分类,建立相应的一组关于颜色集的先验知识。利用上述先验知识对书画数字图像进行基于颜色集的分层,即将属于同一颜色集的图像像素层析到相应的色层中。
其次,考虑到中国书画的绘画技法,以及颜色运用等的特点,如上述先验知识设计合理,则在各色层上会形成一些位置相邻的像素集,即图像区域,且这些图像区域对于整幅图像而言,孤立且闭合。则通过上述方法对书画数字图像进行分层后,可以将图像中包含的色彩、结构,甚至绘画技法等语义信息,以各图像区域为载体,层析到各颜色层上。于是在特定色层上包含同质语义信息的图像区域相对集中,这使得运用传统的图像处理和分析方法即可提取和研究这些特征信息,较之现有方法变得相对简单。为实现中国书画作品的各要素的分割提取,如技法、分类、构图、主题,甚至意境等中、高层语义的研究奠定了基础。为书画作品的图像检索、分类和自动语义标注等提供了一种全新的研究思路。
最后,本发明方法考虑到基于先验知识的分层方法具有一定的局限性,还通过特定颜色空间的聚类分析方法对所获得的书画作品进行分析。将分析的结果利用机器学习的方法对基于先验知识的颜色分层模型进行改进,使模型逐渐趋于合理。
如图1所示,颜色分层分析模型的建立和学习过程步骤如下:
1、获取书画数字图像的颜色先验知识:
1)利用HSV颜色空间的饱和度描述非彩色颜色集
计算机中图像颜色的描述一般采用RGB颜色空间,但是RGB颜色空间是一种亮度和色调混合的颜色空间,不适合对彩色进行分类和表示。本发明采用CIELab颜色空间进行各颜色集的描述,而由于黑色和白色颜色集属于非彩色颜色集,在CIE Lab颜色空间中不能有效描述,因此采用HSV颜色空间的饱和度来区分非彩色颜色集的黑色颜色集和白色颜色集。从RGB到HSV颜色空间的转换关系为:
Figure A20091008237200091
S = 0 , V = 0 D V , V ≠ 0
V=max(R,G,B)
V0=min(R,G,B)
其中,D=V-V0,H∈[0,360],S∈[0.0,1.0],V∈[0.0,1.0],H、S、V和R、G、B分别为HSV颜色空间和RGB颜色空间中对应颜色分量。综上所述,中国书画作品非彩色颜色集在HSV颜色空间的先验知识如下:
黑色颜色集:S≤0.1,V≤0.6;
白色颜色集:S≤0.1,V≥0.7。
2)利用CIE Lab颜色空间描述彩色颜色集
计算机中图像颜色的描述一般采用RGB颜色空间,本发明针对在CIE Lab颜色空间描述的中国书画数字图像颜色分层模型,将输入的书画数字图像进行图像空间的转换。即借助XYZ颜色空间,将书画数字图像由RGB颜色空间转换到CIE Lab颜色空间。从RGB到XYZ颜色空间的转换关系因依推荐标准而异,本实例采用在标准光源D65(即色温为6504°K的日光)下的转换关系:
X Y Z = 0.412411 0.357585 0.180454 0.212649 0.715169 0.072182 0.019332 0.119195 0.950390 R G B
其中,X、Y、Z和R、G、B分别为各自颜色空间中对应颜色分量;再由XYZ到CIE Lab有以下转换关系:
L=116f(Y/Y0)-16
a=500[f(X/X0)-f(Y/Y0)]
b=200[f(Y/Y0)-f(Z/Z0)]
其中,L、a、b为CIE Lab颜色空间中的各分量,X0,Y0,Z0是XYZ国际坐标制中参考白点的三色刺激值。在函数f(t)中,当t>(6/29)3时,
f(t)=t1/3
否则,
f ( t ) = 1 3 ( 29 6 ) 2 t + 16 / 116
将图像在CIE Lab空间中每个像素点的a和b分量使用其极坐标(C*,hab)表示:
C * = a 2 + b 2
hab=arctan(b/a)
综上所述,中国书画作品颜色集在CIE Lab颜色空间的先验知识如下:
红色颜色集:5≤L≤90,9≤C*,330≤hab或0≤hab≤50;
黄色颜色集:L≤98,9≤C*,61≤hab≤100;
蓝色颜色集:5≤L≤90,9≤C*,180≤hab≤330;
绿色颜色集:20≤L≤90,9≤C*,101≤hab≤180。
2、用机器学习方法建立颜色分层的原始颜色描述模型
a)利用先验知识建立训练样本集
根据先验知识,在各颜色集上随机取10000个样本数据,作为建立原始颜色描述模型的训练样本集,为书画数字图像的颜色分层奠定基础。对于彩色颜色集(红、黄、蓝、绿),在CIE Lab颜色空间直接选取样本数据,并将a、b分量用极坐标(C*,hab)表示;对于非彩色颜色集(黑、白),需在HSV颜色空间中选取样本数据,并将其借助RGB颜色空间转换到CIE Lab颜色空间,并将a、b分量用极坐标(C*,hab)表示。
从HSV颜色空间到RGB颜色空间的转换关系是:
Figure A20091008237200103
f = H 60 - h
u=V×(1-S)
v=V×(1-f×S)
w=V×(1-(1-f)×S)
对于RGB颜色空间中的每个颜色分量(R,G,B),
( R , G , B ) = ( V , w , u ) , ifh = 0 ( v , V , u ) , ifh = 1 ( u , V , w ) , ifh = 2 ( u , v , V ) , ifh = 3 ( w , u , V ) , ifh = 4 ( V , u , v ) , ifh = 5
其中,H、S、V和R、G、B分别为HSV颜色空间和RGB颜色空间中对应颜色分量。
b)设计原始颜色描述模型
本实施例选用按误差逆传播算法训练的三层BP神经网络,网络结构为:输入层、隐层和输出层。模型也可采用其他类型的神经网络,或其他机器学习算法,如支持向量机(SVM)、决策树、序列分析、k近邻等方法重新构建模型。在本实施例中,通过比选,训练函数选用Levenberg Marquardt的BP算法训练函数trainlm,隐层传递函数选用正切S型传递函数tansig,输出层传递函数采用线性传递函数purelin,学习函数采用梯度下降动量学习规则learngdm,性能分析函数采用均方差性能分析函数MSE:
MSE = 1 n out p Σ i = 1 p Σ j = 1 n out ( y ~ ij - y ij ) 2
其中,nout为输出层神经元的个数,p为训练样本数目,
Figure A20091008237200112
为网络期望输出值,yij为网络实际输出值。MSE函数描述网络输出和目标输出之间的均方误差。
如图2所示,根据三层BP神经网络的隐层神经元个数n的经验公式、输出层神经元个数nout公式以及实验数据综合优化结果得到,当神经网络的输入层神经元个数nin=3、隐层神经元个数n=11、输出层神经元个数nout=3时,神经网络的训练过程收敛且较稳定。输入样本的CIE Lab空间的分量表示:(L,C*,hab);输出输入样本所属的颜色层标号,用三位二进制数表示,例如颜色层1的三位二进制为001。
隐层神经元个数经验公式:
n = n in + n out + t
其中,n为隐层神经元数;nin为输入层神经元数;nout为输出层神经元数;t为1~10之间的常数。
输出层神经元个数经验公式:
Figure A20091008237200114
则网络的输出是m的二进制编码,其中,m为输出的类别模式数,即色层数目,本实施例中m=6。
c)训练颜色分层的原始颜色描述模型
根据步骤a)中选取的训练样本集,通过步骤b)BP神经网络的首次学习,记录学习到的权值系数,得到用于描述颜色集的原始颜色描述模型。即将样本数据的L分量和a、b分量极坐标(C*,hab)输入BP神经网络,逐样本进行网络计算,采用最速下降法学习规则通过反向传播不断修正调整权值和阈值进行学习训练,当输出层误差平方和小于指定误差E或学习次数大于设定的最大学习次数M时,训练过程结束,输出原始颜色描述模型。本发明的实施例中,指定误差E为0.001,最大学习次数M为100。
下面通过实施例,对原始颜色描述模型的训练过程进行进一步说明,其步骤如下:
①网络初始化
输入步骤a)中所述的训练样本集,为各连接权值分别赋值,设定误差函数为均方差性能分析函数MSE,指定误差E=0.001和最大学习次数M=100。根据:
MSE = 1 n out p Σ i = 1 p Σ j = 1 n out ( y ~ ij - y ij ) 2
其中,p为训练样本数目, y ~ ij = ( y ~ i 1 , y ~ i 2 , · · · , y ~ in out ) 为网络期望输出值, y ij = ( y i 1 , y i 2 , · · · , y in out ) 为网络实际输出值,nout为输出层神经元个数。
②选取第i个输入样本数据xin(i)及其对应的期望输出
Figure A20091008237200124
i=1,2,…,p,j=1,2,…,nout。本实施例中,nout=3,则有:
xin(i)=(L(i),C*(i),hab(i))
y ~ ij = ( y ~ i 1 , y ~ i 2 , y ~ i 3 )
其中,
Figure A20091008237200126
分别为xin(i)所属的颜色层标号的二进制数。如输出
Figure A20091008237200127
为0,
Figure A20091008237200128
为1,为1,则xin(i)的颜色标号为3,属于第3颜色层。
③计算隐层各神经元的输入Hin,h和输出Hout,h
H in , h ( i ) = Σ q = 1 n in w in , qh x q ( i ) - b h
Hout,h(i)=f(Hin,h(i))
y in , j ( i ) = Σ h = 1 n w out , hj H out , h ( i ) - b j
yij=f(yin,j(i))
其中,nin为输入层神经元数,n为隐层神经元数,nout为输出层神经元数;win,qh为输入层与隐层的权值,wout,hj为隐层与输出层的权值,h=1,2,…,n;bh为隐层各神经元的阈值,bj为输出层各神经元的阈值,j=1,2,…,nout,xq(i)为输入层各神经元的输入,q=1,2,…,nin,yin,j(i)是输出层神经元的输入。
④利用步骤b)中的网络期望输出值
Figure A200910082372001212
和网络实际输出值yij,计算误差函数MSE对输出层各神经元的偏导数δout(i)
∂ MSE ∂ w out , h = ∂ MSE ∂ y in , j ( i ) ∂ y in , j ( i ) ∂ w out , h
∂ y in , j ( i ) ∂ w out , h = ∂ ( Σ h = 1 n w out , h H out , h ( i ) - b j ) ∂ w out , h = H out , h ( i )
∂ MSE ∂ y in , j ( i ) = ∂ ( 1 n out p Σ i = 1 p Σ j = 1 n out ( y ~ ij - y ij ) 2 ) ∂ y in , j ( i ) = - ( y ~ ij - y ij ) y ij ′
= - ( y ~ ij - y ij ) f ′ ( y in , j ( i ) ) - δ out ( i )
⑤利用隐层到输出层的连接权值wout,h(i)、win,h(i),输出层各神经元的偏导数δout(i)和隐层的输出Hout,h(i),计算误差函数MSE和隐层各神经元的偏导数δh(i)
∂ MSE ∂ w out , h ( i ) = ∂ MSE ∂ y in , j ( i ) ∂ y in , j ( i ) ∂ w out , h ( i ) = - δ out ( i ) H out , h ( i )
∂ MSE ∂ w in , h ( i ) = ∂ MSE ∂ H in , h ( i ) ∂ H in , h ( i ) ∂ w in , h ( i )
∂ H in , h ( i ) ∂ w in , h ( i ) = ∂ ( Σ h = 1 n w in , h ( i ) x q ( i ) - b j ) ∂ w in , h ( i ) = x q ( i )
∂ MSE ∂ H in , h ( i ) = ∂ ( 1 n out p Σ i = 1 p Σ j = 1 n out ( y ~ ij - y ij ) 2 ) ∂ H out , h ( k ) ∂ H out , h ( i ) ∂ H in , h ( i )
= - ( Σ j = 1 n out δ out ( i ) w out , h ( i ) ) f ′ ( H in , h ( i ) ) - δ n ( i )
⑥利用输出层各神经元的输出层偏导数δout(i)和隐层各神经元的输出Hout,h(i)来修正连接权值wout,h(i)。
Δ w out , h ( i ) = - μ ∂ MSE ∂ w out , h ( i ) = μ δ out ( i ) H out , h ( i )
wout,h N+1(i)=wout,h N(i)+ηδout(i)Hout,h(i)
其中,N为学习次数,最大学习次数为M,μ、η各为学习率参数。
⑦利用隐层各神经元的偏导数δh(i)和输入层各神经元的输入xq(i)来修正连接权值win,h(i)。
Δ w in , h ( i ) = - μ ∂ MSE ∂ w in , h ( i ) = - μ ∂ MSE ∂ H in , h ( i ) ∂ H in , h ( i ) ∂ w in , h ( i ) = δ h ( i ) x q ( i )
win,h N+1(i)=win,h N(i)+ηδh(i)xq(i)
⑧计算全局误差ξ
ξ = MSE = 1 n out p Σ i = 1 p Σ j = 1 n out ( y ~ ij - y ij ) 2
⑨判断全局误差ξ是否满足要求。若全局误差ξ达到预设精度E=0.001,或训练次数大于设定的最大次数M=100,则结束训练过程。否则,选取下一个训练样本及对应的期望输出返回到第③步,进入下一轮训练。以此不断修正参数,降低原始颜色描述模型的全局误差ξ。
3、对颜色分层的原始颜色描述模型进行反馈学习:
i)对书画数字图像进行基于先验知识的聚类分析
首先应将提交的书画数字图像样本,进行颜色空间的转换,根据先验知识进行图像分层。根据步骤1)和2)中各颜色集的范围,将样本图像从RGB颜色空间分别转化到HSV颜色空间和CIE Lab颜色空间,根据像素点的颜色取值建立各颜色层对应的掩码矩阵mask,具体方法如下:
根据先验知识建立颜色集φ={βl},本实施例中l=1,2,...,6。建立与β1,β2,...,β6一一对应的掩码矩阵(maskl)C×D,其中C为书画数字图像的垂直方向的最大像素数,D为书画数字图像的水平方向的最大像素数。先将各掩码矩阵maskl中的元素均初始化为0。
设φ={β1,β2,...,β6},对一幅书画数字图像进行逐像素点判断,若像素点fcd属于φ,则进一步判断,其中c∈[1,C],d∈[1,D]。若判断得知像素点fcd属于某一颜色集βl,则将与之对应的掩码矩阵maskl中的第c行,第d列个元素置为1;若像素点fcd不属于φ,则将其作为暂时不能识别的颜色归入第7个色层,即杂色层的掩码矩阵。
对如图3所示的书画数字图像,按上述方法建立相应的掩码矩阵。图4~图10所示,根据各颜色层的掩码矩阵maskl可得各颜色层的二值图像。如图11~图17所示,在RGB颜色空间上利用上述的各层二值图像与原图像按像素点做与运算,可以得到图像的各颜色集图层。从各颜色集图层中可以看出,单纯利用先验知识进行分层的效果并不理想。因此本实施例采用聚类分析的方法进行修正,考虑到非彩色图层(黑色和白色图层)的特殊性,使非彩色图层不参与聚类计算。若一些彩色图层(如红、黄、蓝、绿,4个颜色的彩色图层)中不包含像素点,则认为该图层不存在。
设上述处理后所得的颜色图层数为m,将m作为聚类中心数,对去除了黑、白两类颜色的样本图像进行聚类分割。本实施例对于CIE Lab颜色空间的L、a和b三个分量采用Kmeans聚类分割方法,除此之外也可采用其他聚类分析方法,如模糊聚类(FCM),基于蚁群的聚类方法、k-medoids、DBSCAN、ROCK方法等。Kmeans聚类分割方法步骤如下:
I)将图像转换到CIE Lab空间,针对各个像素点的L、a、b分量给出p个混合样本Xk,k=1,2,...,p,Xc(d-1)+d=(ML(c,d),Ma(c,d),Mb(c,d))。其中,p=C×D,ML(c,d)为去除非彩色图层的样本图像在CIE Lab颜色空间的L分量矩阵,Ma(c,d)为去除非彩色图层的样本图像在CIE Lab颜色空间的a分量矩阵;Mb(c,d)为去除非彩色图层的样本图像在CIE Lab颜色空间的b分量矩阵。
II)令I=1,初始化m个初始聚类中心Zg(I),g=1,2,3,...,m
Zg(I)=[Lg,ag,bg]
其中,Lg,ag,bg分别为第g层图像中像素点在CIE Lab空间下三分量的均值。
III)计算每个样本Xk与聚类中心Zg(I)的距离δ(Xk,Zg(I)),δ(Xk,Zg(I))为欧氏空间的距离,即δ(Xk,Zg(I))=||Xk-Zg(I)||,即为像素点之间的色度差。如果δ(Xk,Zg(I))满足δ(Xk,Zg(I))=min{δ(Xk,Zg(I)),k=1,2,...,p},则Xk∈βl,βl为第l个颜色聚类集,其中l=1,2,...,m,m为颜色图层数目。
IV)计算m个新的聚类中心Zg(I+1)与新的类间离散度之和为聚类判别准则函数J(I+1):(其中,ng是为第g个颜色聚类集中的样本数)
Z g ( I + 1 ) = 1 n g Σ i = 1 n g X k ( g ) , g = 1,2 , . . . , m
J ( I + 1 ) = Σ g = 1 α Σ X k ∈ β l δ ( X k , Z g ( I + 1 ) )
V)若|J(I+1)-J(I)|<l,则算法结束,否则I=I+1,返回步骤III)。
如图18~图21所示,利用上述聚类分析结果,对去除非彩色图层的样本图像进行分割。
ii)利用聚类分析的数据结果,进行反馈学习,不断改进原始颜色描述模型
本实施例根据基于先验知识分割的非彩色(黑色、白色)图层对应的色层标号以及聚类分割得到的彩色图层对应的色层标号作为神经网络的期望输出。将样本图像各像素点的L分量和a、b分量极坐标(C*,hab)输入BP神经网络,逐个像素进行网络计算。最后采用最速下降法学习规则通过反向传播不断修正调整权值和阈值进行学习训练,当输出层误差平方和小于指定误差E=0.001或学习次数大于设定的最大次数M=100时,训练过程结束。进而得到基于BP网络改进后的颜色描述模型。
4、利用颜色描述模型,对输入的书画数字图像进行颜色分层
综上所述,经过多次样本的反馈学习后,该颜色描述模型可以精确的对图像进行颜色分层。颜色描述模型对书画数字图像进行颜色分层的步骤如下:
首先将输入的书画数字图像转换到CIE Lab空间,并将L分量和a、b分量的极坐标(L,C*,hab)作为神经网络的输入,进行逐像素点的网络计算,输出各像素点所属的色层标号。根据各像素点的色层标号实现图像分层:
A)在颜色分层颜色描述模型输入测试样本图像各像素点的CIE Lab空间的分量(L,C*,hab)cd
B)输出用三位二进制表示的所属颜色层标号。
C)根据输出的色层标号构造各颜色层对应的掩码矩阵mask:设像素点fcd的输出为outcd,outcd的十进制为取值为
Figure A20091008237200161
Figure A20091008237200162
为该像素点所对应的颜色层标号。根据步骤i),若则建立相应色层的掩码矩阵maskl;若
Figure A20091008237200164
则将其作为暂时不能识别的颜色归入杂色层掩码矩阵。
如图22所示书画数字图像,按上述方法建立相应的掩码矩阵。如图23~图29所示,掩码矩阵在RGB空间中可以利用二值图直观表示。如图30~图36所示,在RGB颜色空间上利用上述的各层二值图像与原图像按像素点做与运算,可以实现对图像的分层。
如图37所示,本实施例利用中国书画颜色分层模型对一幅花鸟画进行分层分割。如图38~图44所示,为基于先验知识的分层效果。如图45~图50所示,为通过10次反馈学习后的模型的分层效果。
本发明期望建立一种针对中国书画作品的颜色分层分析方法,利用中国书画作品颜色表征结构的特点对其进行分层,将图像中包含的色彩、结构,甚至绘画技法等语义信息层析到各颜色层上,使得包含同质语义信息的图像区域更加集中,为运用传统的图像处理和分析方法实现中国书画作品的技法、分类、构图,以及意境等中高层语义标注奠定了基础。从而在一定程度上解决了书画数字图像处理领域低层特征和高层语义之间“语义鸿沟”的问题,有助于提高书画作品的检索率和鉴定的准确率,并且为辨别书画作品的真伪提供辅助依据。

Claims (7)

1、一种基于机器学习的中国书画颜色分层分析方法,其特征在于:对同类图像样本进行像素级别的颜色分类,建立一组关于颜色集的先验知识;利用所述先验知识对图像进行基于所述颜色集的分层;将图像中包含的语义信息,以各图像区域为载体,层析到各所述颜色层上;实现所述图像的各要素的分割提取;其步骤包括:
1)获取数字图像的颜色先验知识;
2)用机器学习方法建立颜色分层的原始颜色描述模型;
3)对所述原始颜色描述模型进行反馈学习,得到颜色描述模型;
4)利用所述颜色描述模型,对输入的书画数字图像进行颜色分层。
2、如权利要求1所述的一种基于机器学习的中国书画颜色分层分析方法,其特征在于:所述步骤1)分为:a)利用HSV颜色空间的饱和度描述非彩色颜色集;b)利用CIE Lab颜色空间描述彩色颜色集。
3、如权利要求1所述的一种基于机器学习的中国书画颜色分层分析方法,其特征在于:所述步骤2)分为:c)利用所述先验知识建立训练样本集;d)基于机器学习方法设计原始颜色描述模型;e)训练所述原始颜色描述模型。
4、如权利要求2所述的一种基于机器学习的中国书画颜色分层分析方法,其特征在于:所述步骤2)分为:c)利用所述先验知识建立训练样本集;d)基于机器学习方法设计原始颜色描述模型;e)训练所述原始颜色描述模型。
5、如权利要求1或2或3或4所述的一种基于机器学习的中国书画颜色分层分析方法,其特征在于:所述步骤3)分为:f)对数字图像进行基于先验知识的聚类分析;g)利用所述聚类分析的数据结果,对所述原始颜色描述模型进行反馈学习。
6、如权利要求1或2或3或4所述的一种基于机器学习的中国书画颜色分层分析方法,其特征在于:所述步骤c)中,对于所述非彩色颜色集,先从HSV颜色空间中选取样本数据,再借助RGB颜色空间转换到CIE Lab颜色空间,之后用极坐标(C*,hab)表示a、b分量;对于所述彩色颜色集,在CIE Lab颜色空间直接用极坐标(C*,hab)表示a、b分量。
7、如权利要求5所述的一种基于机器学习的中国书画颜色分层分析方法,其特征在于:所述步骤c)中,对于所述非彩色颜色集,先从HSV颜色空间中选取样本数据,再借助RGB颜色空间转换到CIE Lab颜色空间,之后用极坐标(C*,hab)表示a、b分量;对于所述彩色颜色集,在CIE Lab颜色空间直接用极坐标(C*,hab)表示a、b分量。
CN2009100823722A 2009-04-15 2009-04-15 一种基于机器学习的中国书画颜色分层分析方法 Expired - Fee Related CN101556652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100823722A CN101556652B (zh) 2009-04-15 2009-04-15 一种基于机器学习的中国书画颜色分层分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100823722A CN101556652B (zh) 2009-04-15 2009-04-15 一种基于机器学习的中国书画颜色分层分析方法

Publications (2)

Publication Number Publication Date
CN101556652A true CN101556652A (zh) 2009-10-14
CN101556652B CN101556652B (zh) 2011-11-30

Family

ID=41174759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100823722A Expired - Fee Related CN101556652B (zh) 2009-04-15 2009-04-15 一种基于机器学习的中国书画颜色分层分析方法

Country Status (1)

Country Link
CN (1) CN101556652B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408618A (zh) * 2016-08-31 2017-02-15 上海交通大学 一种基于机器学习的图像解构方法
CN109949333A (zh) * 2019-03-20 2019-06-28 北京暴雷科技有限公司 一种基于颜色解混的文字图章分离技术
US11436771B2 (en) 2020-11-20 2022-09-06 International Business Machines Corporation Graph-based color description generation

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1687961A (zh) * 2005-04-19 2005-10-26 浙江大学 一种计算机辅助的国画真伪鉴别方法
CN1925531A (zh) * 2005-09-02 2007-03-07 丘熊熊 中国画及书法作品的数字化仿真复制方法
CN101122999B (zh) * 2007-04-16 2010-07-07 北京联合大学 一种自动提取中国书画作品中印章图像的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408618A (zh) * 2016-08-31 2017-02-15 上海交通大学 一种基于机器学习的图像解构方法
CN106408618B (zh) * 2016-08-31 2019-05-07 上海交通大学 一种基于机器学习的图像解构方法
CN109949333A (zh) * 2019-03-20 2019-06-28 北京暴雷科技有限公司 一种基于颜色解混的文字图章分离技术
US11436771B2 (en) 2020-11-20 2022-09-06 International Business Machines Corporation Graph-based color description generation

Also Published As

Publication number Publication date
CN101556652B (zh) 2011-11-30

Similar Documents

Publication Publication Date Title
CN100573523C (zh) 一种基于显著区域的图像查询方法
CN104809187B (zh) 一种基于rgb‑d数据的室内场景语义标注方法
CN108564029A (zh) 基于级联多任务学习深度神经网络的人脸属性识别方法
CN108288035A (zh) 基于深度学习的多通道图像特征融合的人体动作识别方法
CN103942564B (zh) 基于非监督特征学习的高分辨率遥感影像场景分类方法
CN107316015A (zh) 一种基于深度时空特征的高精度面部表情识别方法
CN107180248A (zh) 基于联合损失增强网络的高光谱图像分类方法
CN106504233A (zh) 基于Faster R‑CNN的无人机巡检图像电力小部件识别方法及系统
CN107292339A (zh) 基于特征融合的无人机低空遥感影像高分地貌分类方法
CN106980854A (zh) 车牌号码识别方法、装置、存储介质及处理器
CN106056155A (zh) 基于边界信息融合的超像素分割方法
CN105046272B (zh) 一种基于简洁非监督式卷积网络的图像分类方法
CN101122999B (zh) 一种自动提取中国书画作品中印章图像的方法
CN108734719A (zh) 一种基于全卷积神经网络的鳞翅目昆虫图像前背景自动分割方法
CN107895028A (zh) 采用深度学习的草图检索方法
CN108229503A (zh) 一种针对服装照片的特征提取方法
CN108320274A (zh) 一种基于双通道循环生成对抗网络的红外视频彩色化方法
CN108681706A (zh) 一种双源遥感数据语义分割方法
CN108875076A (zh) 一种基于Attention机制和卷积神经网络的快速商标图像检索方法
CN108846404A (zh) 一种基于相关约束图排序的图像显著性检测方法及装置
CN105138975B (zh) 一种基于深度信念网络的人体肤色区域分割方法
CN101556652B (zh) 一种基于机器学习的中国书画颜色分层分析方法
CN109344898A (zh) 基于稀疏编码预训练的卷积神经网络图像分类方法
CN105957124A (zh) 具有重复场景元素的自然图像颜色编辑方法及装置
CN104268580B (zh) 一种基于场景分类的类漫画布局图像管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111130

Termination date: 20160415

CF01 Termination of patent right due to non-payment of annual fee