CN103336942A

CN103336942A - 一种基于Radon BEMD变换的国画鉴定方法

Info

Publication number: CN103336942A
Application number: CN2013101565071A
Authority: CN
Inventors: 杨力华; 汪扬; 陈伟安; 王坚; 贝汉雄; 方海腾; 林琳; 朱劲中
Original assignee: GUANGZHOU MUSEUM OF ART; Sun Yat Sen University
Current assignee: GUANGZHOU MUSEUM OF ART; Sun Yat Sen University
Priority date: 2013-04-28
Filing date: 2013-04-28
Publication date: 2013-10-02

Abstract

本发明公开了一种基于Radon BEMD变换的国画鉴定方法，包含：对某个国画作家的真迹和赝品按相同分辨率进行采集，形成画作库；对每幅图像采集长宽相等且笔触丰富的小块，形成样本库；对每个样本提取特征，形成特征向量库；利用随机抽取器将特征向量库分为训练集和测试集；根据0.632自助法和支持向量机方法训练出多个较优的分类模型，以ROC曲线为评估标准；利用专家投票法对测试集中的特征向量进行鉴定，以鉴定准确率的方式输出结果。本发明无需对比分析真伪国画中的多种局部内容，具有更广泛的适用范围和更高的可操作性；本发明筛除噪声和余量后进行特征提取，避免了噪声带来的干扰，且提高国画数字图像真伪鉴定的准确率。

Description

一种基于Radon BEMD变换的国画鉴定方法

技术领域

本发明涉及图像处理及模式识别技术领域，更具体地，是涉及一种采用Radon BEMD变换提取国画作品的特征，以实现国画作品真伪鉴定的基于Radon BEMD变换的国画鉴定方法。

背景技术

近年来，图像处理和模式识别技术已经广泛应用于社会生活之中，尤其是人脸识别、指纹识别、语音识别等在刑事侦察、身份认证方面的应用，极大地节省了人力物力。然而，在艺术品收藏和鉴定领域，例如绘画鉴定领域，图像处理和模式识别技术并没有得到充分的应用。艺术品收藏家、拍卖公司、博物馆等机构仍旧主要依赖专家进行鉴定工作。这种传统的鉴定方法存在工作效率低下的问题。专家在鉴定艺术品，尤其是高仿艺术品时，需要花费较长的时间对其进行考证，鉴定工作的效率较低。若能将书画作品数字化，并由计算机辅助专家进行鉴定工作，不仅有利于经典作品的保存、分享，也能减轻专家的鉴定工作量，提供鉴定结果的佐证，有利于数字化书画博物馆的建设。

在学术界，利用图像处理和模式识别技术进行计算机辅助的艺术品真伪鉴定，已经成为一个新兴的研究热点。1996年，Olshausen和Field提出了稀疏编码模型，指出通过寻找自然图像的稀疏编码表示，可以得到类似于哺乳动物初级视觉皮层简单细胞感受野的基函数。这些基函数具有和简单细胞感受野一致的方向性、空间局部性和带通性。2009年，James M.Huges等利用稀疏编码模型从欧洲著名画家Pieter Bruegel的真迹作品集中提取出基函数集合。他们利用这些基函数集合对测试集中的Bruegel真迹和赝品进行了对比，以较好的统计显著性（即p值）正确识别了真迹（p<10^-5），拒绝了赝品（p<10^-8）。随后，Mao Dong等引进了一种新的二维EMD变换——iterative filtering EMD，并将其用于提取Bruegel作品在不同频率上的特征，有趣的是，他们对Bruegel的其中几幅作品的鉴定结果和某些鉴定专家的看法相类似。

在国画分类和鉴定领域，关晓慧提出了一种基于马尔科夫随机场（Markov Radom Fields）的国画绘画内容的真伪鉴别框架。该框架是一个三层模型，最上层为像素级的马尔可夫随机场，表示对象块中像素真伪状态和灰度值之间的关系。中间层为对象块级模型，在像素的真伪状态已知的前提下推导出对象块的真伪状态。最后一层为对象级模型，根据对象中各个对象块的状态决定整个对象的状态。关晓慧利用该框架在沈周的山水画上进行真伪鉴定，得到了较好的鉴定结果。2011年，鲍鸿等利用SIFT（Scale Invariant FeatureTransform）提取中国国画作品的关键点，利用Bag-Of-Words模型将关键点映射成视觉词汇特征直方图，有效地将国画作品分成了山水、花鸟和人物三种类别。

从实验结果来看，上述的鉴别方法都取得了不错的效果。然而，稀疏编码模型和iterative EMD模型都是针对外国的油画作品。稀疏编码模型的本意是用于自然图像的表示。自然图像的轮廓较为分明，而绘画作品属于人工图像，特别是中国国画作品，因其写意的特点，常常绘神而不绘形，所以轮廓并不像自然图像和油画作品那么分明。关晓慧提出的真伪鉴别模型则局限于绘画的某项内容的对比，例如两幅画作中的树干和树干的对比，并且其只在山水画种类上实验得到了较好的效果，在人物和花鸟画上的鉴别结果并无给出。鲍鸿的SIFT和Bag-Of-Words模型相结合的特征提取方法只是用于国画作品的分类，并没有在鉴定方面的实验结果。

Radon变换早在1917年就已经被提出，但是在快速傅里叶变换算法出现之前它并没有得到充分的关注。现在Radon变换已广泛应用于医学图像的重建。1998年，N.E.Huang等提出了EMD分解的概念，用于一维信号的处理。EMD能够将一个复杂的信号分解为有限个imf，它依据数据自身的时间尺度特征来进行信号分解，无须预先设定任何基函数。这一点与建立在先验性的谐波基函数和小波基函数上的傅里叶分解与小波分解方法具有本质性的差别。因此，EMD在理论上可以应用于任何类型的信号的分解，在处理非平稳及非线性数据上具有非常明显的优势。然而，传统的EMD只能用于一维信号的分解在。二维EMD一直是研究的热点和难点。2009年，杨志华和杨力华提出了一种基于Radon变换的二维EMD算法（Radon BEMD），并且实验结果表明，该二维EMD可以提取图像在不同频率尺度下的分量，和一维EMD具有相似的特性。

绘画作品的真伪鉴定，除了依靠物理和化学方法对作品的年代进行考据，最主要的还是依靠专家对绘画内容和绘画风格的鉴定。优秀的画家都会有自己擅长的绘画风格，更具体地说，其下笔的笔触走势和轻重都自成一格。因此，绘画风格是鉴定画作真伪的一个有效切入点。而绘画风格体现在绘画作品上，就是画作在不同层次上的纹理。从图像处理的角度来说，不同层次的纹理代表的是画作在不同频率范围内的信息。因此绘画真伪鉴定的一个可行方法是提供一种有效提取画作在不同频率尺度下分量的方法。Radon EMD方法是一个有效地提取画作的不同频率尺度下特征的方案。

发明内容

基于上述考虑，本发明的目的在于提出一种基于Radon BEMD变换的国画鉴定方法。

为了实现上述目的，本发明采用以下技术方案：

一种基于Radon BEMD变换的国画鉴定方法，包括以下步骤：

S1.分别对某个国画作家的真迹和赝品按相同分辨率进行采集，以数字图像的形式存储在计算机上，形成画作库；

S2.对每幅图像采集长宽相等且笔触丰富的小块，形成样本库；

S3.对每个样本进行特征提取操作，形成特征向量库；

S4.利用随机抽取器将特征向量库分为训练集和测试集；

S5.根据0.632自助法和支持向量机方法训练出多个较优的分类模型，以ROC曲线为评估标准；

S6.利用专家投票法对测试集中的特征向量进行鉴定，以鉴定准确率的方式输出结果；

其中所述步骤S3形成特征向量库的方式为：

S31.将样本转换为灰度图，对其实施Radon变换得到一系列的Radon向量；

S32.对每个Radon向量实施一维EMD分解，得到一系列的以imf为元素的序列；

S33.从所有imf序列中提取相同下标的imf合并成矩阵，然后实施Radon逆变换，得到一系列的二维imf，即bimf，剔除代表余量和噪声的bimf；

S34.计算每个bimf的不同阶的统计量，将所有bimf的统计量进行特征融合。

其中步骤S1中是采用专业的拍摄仪器对某个国画作家的真迹和赝品按相同分辨率进行采集。

进一步的，所述步骤S2中样本库中样本生成方法如下：

S21.对画作库中的国画数字图像进行编号，真迹编号以字母‘A’开头，记为A₁～A_n，赝品编号以字母‘B’开头，记为B₁～B_m；

S22.从画作库的数字图像中截取长宽均为L且着墨丰富的小块作为样本，每幅图像所得的样本数量记为l，真迹A_i的样本记为A_iS₁□A_iS_l，赝品B_j的样本记为B_jS₁□B_jS_l；i=1，2，……，n；j=1，2，……，m。

其中建议L取值为100，200或者400像素，样本与样本所占的区域可以有重叠。每幅图像所得的样本数量记为l，建议l取值为20。

进一步的，所述步骤S31中Radon变换的过程，包含以下步骤：

S311.对各样本使用加权平均的灰度转换公式进行灰度化，记为灰度样本S，灰度转换公式如下：

gray_scale(x,y)=0.30R(x,y)+0.59G(x,y)+0.11B(x,y)

其中，(x,y)是像素点在样本中的位置，gray_scale(x,y)是像素点(x,y)的灰度值，R(x,y)是像素点(x,y)的颜色的红色分量值，G(x,y)是像素点(x,y)的颜色的绿色分量值，B(x,y)是像素点(x,y)的颜色的蓝色分量值；

S312.分别对步骤S311得到的灰度样本S在角度α上施行Radon变换，获取Radon列向量V_α；其中α为Radon变换的角度参数，Δα为角度步长，

α的初始值为0，并以步长Δα从0递增至(N-1)Δα，经过该步骤共得到N个Radon列向量。

更进一步的，所述步骤S32中对Radon向量施行一维EMD和后补齐的过程，包含以下步骤：

S321.对每一个Radon列向量V_α施行一维经验模态分解EMD，得到M_α个内在模态函数imf，形成内模函数序列

S322.对步骤S321得到的每个imf序列进行后补齐，利用0-imf将序列的元素个数向后补齐至M，其中M为最长imf序列的元素个数，0-imf为全0的向量。

更进一步的，所述步骤S33中Radon逆变换的过程为：将所有imf序列中具有相同下标的imf进行合并，得到

对R⁽ⁱ⁾实施Radon逆变换得到二维EMD分解矩阵bimf_i，i=1,2,…,M；每个灰度样本S将产生M个大小为L×L的二维EMD分解矩阵bimf；剔除最后的两个分别代表余量和噪声的bimf，得到M-2个bimf。

更进一步的，所述步骤S34中特征提取和融合的过程，包含以下步骤：

S341.对二维矩阵bimf_i，计算其不同阶的统计量，包括一阶的均值、二阶的标准差、三阶的偏度、四阶的峭度，以及离群点比例、离群点均值、离群点标准差、离群点偏度、离群点峭度9个统计量，形成统计量序列；

S342.采用串行合并的方法对M-2个bimf的统计量序列进行特征融合，形成灰度样本S的特征向量；真迹A_i的特征向量记为A_if₁□A_if_l，赝品B_j的样本记为B_jf₁□B_jf_l；i=1，2，……，n；j=1，2，……，m。

更进一步的，所述步骤S4中采用随机抽取器建立训练集和测试集的过程为：

随机抽取器的抽取过程需要满足两点要求，①随机抽取器以画作为单位而不是以样本为单位进行抽取，当某幅画被抽中，则其包含的l个样本特征向量将全部被选中；②随机抽取器抽取出的真迹训练集训练集和赝品训练集的数量比为1:1，以平衡训练模型的输入。

更进一步的，所述步骤S5中采用0.632自助法的过程具体为：

设给定的训练集包含d个特征元组，利用随机抽取器对该特征库有放回地抽样d次，产生包含d个允许重复的特征元组的子训练集；多次进行抽样，其结果是在统计情况下，63.2%的训练集元组将出现在子训练集中，其余36.8%的训练集元组出现在检验集中。

更进一步的，所述步骤S5中采用支持向量机方法产生分类模型的过程，包含以下步骤：

S51.特征向量的归一化

归一化函数如下：x_k=(x_k-x_min)/(x_max-x_min)，其中x_k为第k个样本的在x维的取值，x_min为所有子训练集样本在x维取值的最小值，x_max为所有子训练集样本在x维取值的最大值；

S52.确定支持向量机参数

采用LIBSVM工具包进行鉴别试验，分类器模型的参数设置为option=′-t2-s0-c1′，其涵义为支持向量机的核函数为RBF核函数，SVM类型为C-SVC，惩罚系数为1；

S53.评估分类模型的优劣

利用ROC曲线在检验集上评估分类模型的优劣；ROC曲线的纵轴为真正率，横轴为假正率，其反映了分类模型在真迹检验集和赝品检验集上鉴别能力的平衡；曲线下的面积即AUC（Area Under Curve）值越接近于1，说明分类模型的分类能力在两个检验集上的表现越均衡，且准确率也越高；当分类模型的AUC值大于给定阈值p时，认为该分类模型较优，符合要求。

优选的，p取值为0.75。

更进一步的，所述步骤S6中采用专家投票法对测试集中的特征向量进行鉴别的过程具体为：

在划分完训练集和测试集后，迭代施行多次如下的模型生成过程为：利用产生一个子训练集-检验集的划分，在此划分的基础上训练出一个分类模型，然后用ROC曲线在检验集上测试模型的性能，当分类模型符合性能要求时被采纳，成为一个“专家”；迭代运行该过程直至得到k个专家，迭代完成后，所有的专家以相同的权值对测试集中的特征向量进行投票，相当于由k个分类模型形成一个组合分类模型对测试集进行鉴定；组合分类模型的性能以准确率（accuracy）的形式进行展现。

优选的，k取值为21。

本发明由于采用上述技术方案，其具有以下优点：本发明使用了Radon BEMD变换来提取国画数字图像在不同频率尺度下的纹理特征，无需对比分析真伪国画中的多种局部内容（如山石、树干），具有更广泛的适用范围和更高的可操作性；本发明采用了基于Radon变换的EMD分解方法，可将国画数字图像分解为多个imf分量、一个噪声和一个余量，筛除噪声和余量后再进行特征提取操作，避免了噪声带来的干扰，同时在分类模型的输入集上实施数据归一化处理，采用0.632自助法和专家投票法，进一步提高国画数字图像真伪鉴定的准确率。

附图说明

图1是本发明的流程图。

图2是木棉花的样本及其在Radon BEMD变换后得到的不同频率的分量示意图。

图3是由一个分类模型在检验集上画出的ROC曲线图。

图4是分类过程示意图。

图5是分类模型在测试样本集上的鉴别准确率（50次）示意图。

图6是赝品集中的作品B1的数字图像。

具体实施方式

下面结合附图对本发明做进一步的描述，但本发明的实施方式并不限于此。

本发明的具体实施方式包括数据采集过程、特征提取过程和分类模型训练过程。下面结合附图和实施例进行详细的描述，以著名国画家、岭南画派代表人物关山月先生的国画数字图像真伪鉴别为例，展示本发明的具体实施方式。

数据采集过程：

1）如图1所示，利用专业的拍摄设备按照相同的分辨率对关山月先生的真迹以及他人伪造的赝品进行采集，以数字图像的形式存储在计算机上，形成画作库。本实施例采用的拍摄设备是NIKON D700，保存的图像参数为：24为颜色深度，300dpi分辨率，JPG图像文件格式。

2）本实施例的画作库中含有关山月真迹18幅，赝品13幅。

①对画作库中的国画数字图像进行编号，真迹编号以字母‘A’开头，记为A₁～A₁₈，赝品编号以字母‘B’开头，记为B₁～B₁₃；

②从画作库的数字图像中截取长宽均为L且着墨丰富的小块作为样本，形成样本库。本实施例中L取值为400，样本与样本所占的区域可以有重叠。每幅图像所得的样本数量记为l，本实施例中l取值为20。真迹A_i的样本记为A_iS₁□A_iS₂₀，赝品B_j的样本记为B_jS₁□B_jS₂₀；

特征提取过程：

3）对每个样本施行4）至7）的特征提取操作，形成特征向量库。

4）如图1所示，对样本库中的样本进行Radon变换的过程如下：

①对样本库中各样本使用加权平均的灰度转换公式进行灰度化，记为灰度样本S，灰度转换公式如下：

gray_scale(x,y)=0.30R(x,y)+0.59G(x,y)+0.11B(x,y)

其中，(x,y)是像素点在样本中的位置，gray_scale(x,y)是像素点(x,y)的灰度值，R(x,y)是像素点(x,y)的颜色的红色分量值，G(x,y)是像素点(x,y)的颜色的绿色分量值，B(x,y)是像素点(x,y)的颜色的蓝色分量值。

②分别对步骤①得到的灰度样本S在角度α上施行Radon变换，获取Radon列向量V_α。其中α为Radon变换的角度参数，Δα为角度步长，

Δα的取值将对两个方面造成影响：一个是整个特征提取过程的时间，Δα取值越小，特征提取过程所花的时间越长；另一个是所提取出的特征的精度，Δα取值越小，所提取出的特征的精度越高。权衡这两方面的因素，本实施例的Δα取值为1，则N=180。α的初始值为0，并以步长Δα从0递增至179，经过该步骤共得到180个Radon列向量V₀～V₁₇₉。

5）对Radon列向量施行一维EMD和后补齐的过程，包含以下步骤：

①对4）中得到的每一个Radon列向量V_α施行一维EMD（empirical modedecomposition，经验模态分解），得到M_α个imf（intrinsic mode function，内在模态函数），形成内模函数序列

{imf}^{α} = ({imf}_{1}^{α}, {imf}_{2}^{α}, . . ., {imf}_{M_{α}}^{α});

②对步骤①得到的每个imf序列进行后补齐，利用0-imf将序列的元素个数向后补齐至M，其中M为最长imf序列的元素个数，0-imf为全0的向量；

6）Radon逆变换的过程，包含以下步骤：

将5）中得到的所有imf序列中具有相同下标的imf进行合并，得到

对R⁽ⁱ⁾实施Radon逆变换得到二维EMD分解矩阵bimf_i，i=1,2,…,M。这样，每个灰度样本S将产生M个大小为400×400的二维EMD分解矩阵bimf。如图2所示，一个绘有“木棉花”的灰度样本被分解为8个bimf，其中最后两个bimf分别是余量和噪声，这两个bimf被剔除，剩下前6个bimf代表图像从高频到低频的分量。

7）特征提取和融合的过程，包含以下步骤：

①对于6）中所得的二维矩阵bimf_i，计算其不同阶的统计量，包括一阶的均值、二阶的标准差、三阶的偏度、四阶的峭度，以及离群点比例、离群点均值、离群点标准差、离群点偏度、离群点峭度等9个统计量，形成统计量序列；

②采用串行合并的方法对6个bimf的统计量序列进行特征融合，形成灰度样本S的特征向量。真迹A_i的特征向量记为A_if₁□A_if₂₀，赝品B_j的样本记为B_jf₁□B_jf₂₀；

分类模型训练过程，如图4所示：

8）采用随机抽取器建立训练集和测试集的过程，包含以下步骤：

特征向量库具体分为真迹特征库和赝品特征库，前者包含360个特征向量（18幅画作，每幅画作20个样本），后者包含260个特征向量（13幅画作，每幅画作20个样本）。为了得到分类模型，利用随机抽取器从真迹特征库和赝品特征库中各抽取10幅画作的特征向量，产生训练集（包含200个真迹特征向量和200个赝品特征向量）。值得注意的是，为保证分类模型的正确性，同一幅画作的20个特征向量要么全部在训练集中，要么全部在测试集中，所以随机抽取器的抽取单位是画作，而不是样本。另一方面，由于实施例中真迹画作比赝品画作多出5幅，为保证分类模型的平衡性，训练集中的真迹特征向量和赝品特征向量的数量相等。

9）采用0.632自助法和支持向量机产生多个较优分类模型的过程，包含以下步骤：

0.632自助法的目标是将训练集进一步划分为子训练集和检验集，检验集用于检验模型的优劣。真迹训练集包含200个特征元组，利用随机抽取器对该特征库有放回地抽样200次，产生包含200个特征元组（允许重复）的子训练集。其结果是，约有200×63.2%=126个真迹训练集元组将出现在子训练集中，另外74个出现在检验集中。对于赝品训练集采用同样的做法。

在将子训练集输入支持向量机之前，需要将子训练集按照特征向量的每一维进行归一化，避免发生类似“由于某一维的数据值较大而淹没了其他维数据”的数据淹没现象，以提高分类模型的准确率和产生速度。归一化函数如下：x_k=(x_k-x_min)/(x_max-x_min)，其中x_k为第k个样本的在x维的取值，x_min为所有子训练集样本在x维取值的最小值，x_max为所有子训练集样本在x维取值的最大值。

本发明采用LIBSVM工具包进行鉴别实验，但不限于此工具包，在仿真环境Matlab r2010b软件平台上可以利用如下函数模型表示：

model=svmtrain(train_feature,train_label,options);

其中train_label的取值范围为{1，-1}，分别代表真迹和赝品。options（参数设置项）的可用选项所表示的涵义如下：

-s svm类型（默认0)

0--C-SVC

1--V-SVC

2--one-class-SVM

3--ε-SVR

4--γ-SVR

-t核函数类型（默认2）

0--线性核函数

1--多项式核函数

2--RBF核函数

3--sigmoid核函数

-c设置C-SVC，ε-SVR和γ-SVR时的损失函数参数（默认1）

本发明中，建议分类器模型的参数设置为options=’-t2-s0-c1’，其涵义为支持向量机的核函数为RBF核函数，SVM类型为C-SVC，惩罚系数为1。

利用ROC曲线在检验集上评估分类模型的优劣。ROC曲线的纵轴为真正率（True Positive Rate），横轴为假正率（False Positive Rate），其反映了分类模型在真迹检验集和赝品检验集上鉴别能力的平衡。曲线下的面积即AUC值（Area Under Curve）越接近于1，说明分类模型的分类能力在两个检验集上的表现越均衡，且准确率也越高。当分类模型的AUC值大于给定阈值p时，认为该分类模型较优，符合要求。建议p取值为0.75。图3所示的是一个分类模型在其检验集上话画出的ROC曲线，AUC值为0.81448。

10）采用专家投票法对测试集中的特征向量进行鉴别的过程，包含以下步骤：

如图4所示，在划分完训练集和测试集后，迭代施行多次如下的模型生成过程为：利用产生一个子训练集-检验集的划分，在此划分的基础上训练出一个分类模型，然后用ROC曲线在检验集上测试模型的性能，当分类模型符合性能要求时被采纳，成为一个“专家”。迭代运行该过程直至得到k个专家，建议k取值为21。迭代完成后，所有的专家以相同的权值对测试集中的特征向量进行投票，相当于由k个分类模型形成一个组合分类模型对测试集进行鉴定。组合分类模型的性能以准确率（accuracy）和混淆矩阵（confusion matrix）的形式进行展现。

本发明中，分类模型对测试集的样本进行预测时采用LIBSVM工具包，但不限于该工具包，在仿真环境Matlab r2010b软件平台上，可利用如下函数模型表示：

[predicted_label，accuracy，decision_values]

=svmpredict(test_label，test，model，options)；

其中test_label为测试集特征向量的类标号，取值范围为{1，-1}，1代表真迹，-1代表赝品。如果不知道测试集的标签，test_label也可以随意设置，则输出参数accuracy没有意义。test为测试集特征向量。model为svmtrain训练得到的分类模型，options是参数设置项，可选项的含义和svmtrain相同。predicted_label为分类模型预测的测试集类标号。accuracy是分类准确率。decision_values是一个矩阵，默认情况下每一行表示的是分类模型预测的每个测试集特征向量到各个类的距离；若options中包含了‘-b1’，则其每一行表示的是分类模型预测的每个测试集特征向量在各个类别中的概率。本实施例使用的是二分类，所以decision_values是一个n行2列的矩阵，其中n为测试集中特征向量的个数。

鉴别结果分析：

最终鉴别结果的评价尺度有两个，一个是样本级别的，一个是画作级别的，两种评价尺度都采用准确率（accuracy）来展现鉴别结果。由于每一次生成的组合分类模型都是在随机抽取的训练集上得到的，为了消除随机性带来的影响，本实施例将迭代50次分类过程，得到50个组合分类模型。样本级别的准确率直接以图的方式展现，画作级别的准确率将取50次的平均值，再以列表的形式展现，结果如图5，表1和表2所示。

从图5可知，本发明的样本级鉴别准确率在70%以上，在50次随机抽样的分类过程中，有43次的鉴别准确率在80%以上。从表1可知，大多数被普遍认为是真迹的作品都被分类模型归类为真迹，除了A13的比率稍稍偏低（56%）。从表2可知，B1，B3，B5，B7，B8这5幅之前被认为是赝品的作品被分类模型归类为赝品的比率很低，特别是B1，在50次分类过程中，没有一次被分类为赝品，其可能的原因有几种：一是该画作不是赝品，而是关山月先生的真迹；一是由于本发明的分类模型不够精细，只采用了SVM进行二分类，而实际上不同的赝品很可能是由多个不同的模仿者仿造的，所以不同赝品的风格差别也很大，因为B1的绘画风格和其他赝品的风格差别很大，所以无法和其他赝品归为一类。B1的数字图像如图6所示。

本发明的国画数字图像鉴别方法在50次随机抽取样本的分类过程中，得到了最差为70%以上的样本级准确率；且能够以较高的比率识别出大多数之前被认为是真迹和赝品的画作。然而，某幅赝品品的鉴别结果与之前专家的鉴别结果不一致，这说明本发明可能需要考虑更精细的分类，以区分不同赝品作者的风格。聚类分析和支持向量机的结合可能是一个有效的解决方案。

表118幅关山月真品在50次分类中被预测为真的比例

真迹编号

被预测为真的比率

真迹编号

被预测为真的比率

A1	0.92	A10	0.95
				A2	0.83	A11	0.87
A3	0.95	A12	0.74
				A4	0.90	A13	0.56
A5	0.80	A14	0.77
				A6	0.75	A15	0.92
A7	0.86	A16	0.88
				A8	0.76	A17	0.95
A9	0.84	A18	0.92

表213幅关山月赝品在50次分类中被预测为假的比例

赝品编号	被预测为假的比率	真迹编号	被预测为假的比率
				B2	0.91	B1	0.06
B4	0.84	B3	0.30
				B6	0.95	B5	0.16
B9	0.81	B7	0.28
				B10	0.90	B8	0.41
B11	0.82
				B12	0.82
B13	0.80

以上所述的本发明的实施方式，并不构成对本发明保护范围的限定。任何在本发明的精神原则之内所作出的修改、等同替换和改进等，均应包含在本发明的权利要求保护范围之内。

Claims

1.一种基于Radon BEMD变换的国画鉴定方法，其特征在于，包括：

S3.对每个样本进行特征提取操作，形成特征向量库；

S4.利用随机抽取器将特征向量库分为训练集和测试集；

其中所述步骤S3形成特征向量库的方式为：

2.根据权利要求1所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S2中样本库中样本生成方法如下：

3.根据权利要求1或2所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S31中Radon变换的过程，包含以下步骤：

gray_scale(x,y)=0.30R(x,y)+0.59G(x,y)+0.11B(x,y)

4.根据权利要求3所述基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S32中对Radon向量施行一维EMD和后补齐的过程，包含以下步骤：

{imf}^{α} = ({imf}_{1}^{α}, {imf}_{2}^{α}, . . ., {imf}_{M_{α}}^{α});

5.根据权利要求4所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S33中Radon逆变换的过程为：将所有imf序列中具有相同下标的imf进行合并，得到

R^{(i)} = {({imf}_{i}^{0}, {imf}_{i}^{Δα}, . . ., {imf}_{i}^{(N - 1) Δα})}^{T},

对R⁽ⁱ⁾实施Radon逆变换得到二维EMD分解矩阵bimf_i，i=1,2,…,M；每个灰度样本S将产生M个大小为L′L的二维EMD分解矩阵bimf；剔除最后的两个分别代表余量和噪声的bimf，得到M-2个bimf。

6.如权利要求5所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S34中特征提取和融合的过程，包含以下步骤：

7.根据权利要求1或2所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S4中采用随机抽取器建立训练集和测试集的过程为：

随机抽取器的抽取过程需要满足两点要求，①随机抽取器以画作为单位进行抽取，当某幅画被抽中，则其包含的l个样本特征向量将全部被选中；②随机抽取器抽取出的真迹训练集训练集和赝品训练集的数量比为1:1。

8.根据权利要求1或2所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S5中采用0.632自助法的过程具体为：

9.根据权利要求1或2所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S5中采用支持向量机方法产生分类模型的过程，包含以下步骤：

S51.特征向量的归一化

S52.确定支持向量机参数

采用LIBSVM工具包进行鉴别试验，分类器模型的参数设置为option='-t2-s0-c1'，其涵义为支持向量机的核函数为RBF核函数，SVM类型为C-SVC，惩罚系数为1；

S53.评估分类模型的优劣

利用ROC曲线在检验集上评估分类模型的优劣；ROC曲线的纵轴为真正率，横轴为假正率，其反映了分类模型在真迹检验集和赝品检验集上鉴别能力的平衡；曲线下的面积即AUC值越接近于1，说明分类模型的分类能力在两个检验集上的表现越均衡，且准确率也越高；当分类模型的AUC值大于给定阈值p时，认为该分类模型较优，符合要求。

10.根据权利要求1或2所述的基于Radon BEMD变换的国画鉴定方法，其特征在于，所述步骤S6中采用专家投票法对测试集中的特征向量进行鉴别的过程具体为：

在划分完训练集和测试集后，迭代施行多次如下的模型生成过程为：利用产生一个子训练集-检验集的划分，在此划分的基础上训练出一个分类模型，然后用ROC曲线在检验集上测试模型的性能，当分类模型符合性能要求时被采纳，成为一个“专家”；迭代运行该过程直至得到k个专家，迭代完成后，所有的专家以相同的权值对测试集中的特征向量进行投票，相当于由k个分类模型形成一个组合分类模型对测试集进行鉴定；组合分类模型的性能以准确率的形式进行展现。