CN106650751A

CN106650751A - 图像特征提取方法以及数字媒体版权管理方法

Info

Publication number: CN106650751A
Application number: CN201611056326.1A
Authority: CN
Inventors: 关虎; 张桂煊; 曾智; 刘杰; 张树武
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2016-11-25
Filing date: 2016-11-25
Publication date: 2017-05-10
Anticipated expiration: 2036-11-25
Also published as: CN106650751B

Abstract

本发明涉及一种图像特征提取方法及数字媒体版权管理方法。所述图像特征提取方法包括：判断图像是否经历过几何变换，对经历过几何变换的图像进行校正；对图像进行一次尺寸标准化；对一次尺寸标准化后的图像进行规范化操作以及再次尺寸标准化；对规范化后的图像提取特征。所述数字媒体版权管理方法包括：获取数字媒体的版权信息；采用所述图像特征提取方法提取其特征序列；将版权信息与特征序列在数据库中进行对应的登记注册；利用登记注册信息进行数字媒体的版权管理。本发明提高了图像特征提取过程中抵抗常见图像处理攻击和几何攻击的能力，适用于基于图像特征的多媒体检索等领域，并为数字媒体版权管理模式提供了一种新的解决方案和途径。

Description

图像特征提取方法以及数字媒体版权管理方法

技术领域

本发明涉及多媒体检索与数字媒体版权保护技术领域，具体涉及图像特征提取技术以及数字媒体版权管理技术。

背景技术

近年来，随着互联网技术和数字媒体技术的飞速发展，在网络和各种终端设备上存在大量的数字媒体内容资源(例如：文本、图像、音/视频等)，用户可以很容易地对这些数字媒体内容进行复制、修改、传播和使用，因此，对数字媒体内容的版权保护与版权管理已越来越引起学术界和商业界的普遍关注。同时，在对数字媒体进行内容管理的过程中，完整地存储数字媒体的内容会大幅度加重数据库的负载，明显降低内容管理与检索的效率。因此，数字媒体特征提取技术作为一种新兴的数字媒体版权管理技术被应用于该领域。通过该技术实现对数字媒体内容的既具有可区分性又具有鲁棒性的特征提取，能够实现对数字媒体内容的特征存储与检索，同时实现对数字媒体内容的被动监管，从内容管理的角度实现版权保护。

图像特征提取技术经过近几十年的发展，已经取得了一定的研究成果，其中比较典型的一类方法是基于图像规范化的方法，其主要思路是首先将图像进行规范化(包括平移规范化、缩放规范化、旋转规范化等)得到规范化后的图像，然后对该规范化后的图像进行频域变换或系数分解，并对变换域系数或分解系数进行统计分析，通过分析其系数分布来提取特征序列。这类方法在抵抗常见的几何攻击的同时也能够抵抗常见的图像处理攻击。

然而，目前主流的图像规范化方法仍然存在一些亟待解决的问题，其中最主要的问题在于：对于一般意义的图像(尤其是高度和宽度不同的图像)及其几何变换后的图像，在规范化之后很难达到方向、尺寸的一致性，因此很难满足图像稳定特征提取的实际需求。

发明内容

为解决上述现有技术中存在的问题，根据本发明的一个实施例，提供一种图像特征提取方法，包括：

步骤1)、判断图像是否经历过几何变换，对经历过几何变换的图像进行校正；

步骤2)、对所述图像进行一次尺寸标准化，得到一次尺寸标准化后的图像；

步骤3)、对所述一次尺寸标准化后的图像进行规范化操作以及再次尺寸标准化，得到规范化后的图像；

步骤4)、对所述规范化后的图像提取特征。

上述方法中，步骤1)包括：

步骤11)、判断所述图像是否经历过旋转变换，若未经历过旋转变换，则执行步骤2)；

步骤12)、判断所述图像是否经历过非等尺度缩放变换，若未经历过非等尺度缩放变换，则执行步骤14)；

步骤13)、计算所述图像在宽度方向和高度方向上的缩放比例因子的比值，基于该比值对所述图像进行缩放校正；

步骤14)、基于所述图像的旋转角度对所述图像进行旋转校正。

上述方法中，步骤11)包括：

步骤111)、采用0填充的方式将所述图像填充为具有第一正方形尺寸的图像，对其进行全局离散傅里叶变换(Discrete Fourier Transformation，DFT)操作以得到其幅值系数；

步骤112)、根据所得到的幅值系数的分布，寻找经过幅值系数矩阵的中心点的、较大幅值系数所在的两条直线，分别计算这两条直线与水平正方向的夹角；

步骤113)、如果计算得到的两个夹角为0度或90度，则所述图像未经历过旋转变换，执行步骤2)，否则执行步骤12)。

上述方法中，步骤12)包括：

步骤121)、对于在步骤11)中计算得到的两个夹角，计算这两个夹角的差；

步骤122)、如果差为90度，则所述图像未经历过非等尺度缩放变换，执行步骤14)，否则执行步骤13)。

上述方法中，步骤13)包括：

步骤131)、根据下式计算所述图像在宽度方向和高度方向上的缩放比例因子的比值ρ：

其中，β表示所述图像在宽度方向上的缩放比例因子，α表示所述图像在高度方向上的缩放比例因子，θ₁＝δ₁且θ₂＝δ₂-90，δ₁和δ₂分别表示在步骤11)中计算得到的两个夹角，并且δ₁∈[0,90)、δ₂∈[90,180)；

步骤132)、当θ₁＜θ₂时，使所述图像的高度不变，宽度增大到原宽度的1/ρ倍；当θ₁＞θ₂时，使所述图像的宽度不变，高度增大到原高度的ρ倍。

上述方法中，步骤14)包括：

当所述图像未经历过缩放校正时，根据在步骤11)中计算得到的两个夹角估计所述图像的旋转角度，根据该旋转角度对所述图像进行旋转校正；

当所述图像经历过缩放校正时，对缩放校正后的图像重新进行全局DFT操作以得到其幅值系数并重新计算两个夹角，根据重新计算的两个夹角估计所述图像的旋转角度，以及根据该旋转角度对所述图像进行旋转校正。

上述方法中，步骤2)包括：根据第二正方形尺寸缩放所述图像，得到一次尺寸标准化后的图像。

上述方法中，步骤3)包括：对所述一次尺寸标准化后的图像依次进行平移规范化、缩放规范化、旋转规范化、翻转规范化和再次尺寸标准化，得到规范化后的图像。

在步骤3)中，对所述一次尺寸标准化后的图像进行平移规范化可包括：

根据下式计算所述一次尺寸标准化后的图像的平移规范化后的坐标(x_c,y_c)：

其中，x、y分别表示所述一次尺寸标准化后的图像I(x,y)的横、纵坐标并且x＝0,1,…,M-1，y＝0,1,…,N-1，M和N分别表示所述一次尺寸标准化后的图像的高度和宽度，分别表示所述一次尺寸标准化后的图像的质心的横、纵坐标，m为所述一次尺寸标准化后的图像的中心矩并且其中p和q表示图像矩的阶；

根据所计算的平移规范化后的坐标对所述一次尺寸标准化后的图像进行平移变换，得到平移规范化后的图像I(x_c,y_c)。

在步骤3)中，所述缩放规范化可包括：

根据下式计算所述平移规范化后的图像I(x_c,y_c)在高度方向和宽度方向上的缩放因子：

其中，μ^c表示所述平移规范化后的图像的几何矩并且M_c和N_c分别表示所述平移规范化后的图像I(x_c,y_c)的高度和宽度，分别表示图像I(x_c,y_c)的质心的横、纵坐标；

根据计算得到的两个缩放因子对所述平移规范化后的图像进行缩放变换，得到缩放规范化后的图像I(x_s,y_s)。

在步骤3)中，所述旋转规范化可包括：

根据下式计算所述缩放规范化后的图像I(x_s,y_s)的旋转角度：

其中，μ^s表示所述缩放规范化后的图像的几何矩并且M_s和N_s分别表示所述缩放规范化后的图像I(x_s,y_s)的高度和宽度，分别表示图像I(x_s,y_s)的质心的横、纵坐标；

根据计算得到的旋转角度对所述缩放规范化后的图像进行逆向θ角度的旋转变换，得到旋转规范化后的图像I(x_r,y_r)。

在步骤3)中，所述翻转规范化可包括：

步骤a)、根据下式计算所述旋转规范化后的图像I(x_r,y_r)的单边奇数阶几何矩和d为奇数：

其中，M_r和N_r分别表示所述旋转规范化后的图像I(x_r,y_r)的高度和宽度，分别表示图像I(x_r,y_r)的质心的横、纵坐标；

步骤b)、当大于0且大于0时，对所述旋转规范化后的图像不作任何操作；

当小于0且大于0时，将所述旋转规范化后的图像进行一次垂直翻转；

当大于0且小于0时，将所述旋转规范化后的图像进行一次水平翻转；

当小于0且小于0时，将所述旋转规范化后的图像进行一次垂直翻转，并将垂直翻转后的图像再进行一次水平翻转；

步骤c)、得到翻转规范化后的图像。

在步骤3)中，所述再次尺寸标准化包括根据第三正方形尺寸缩放所述翻转规范化后的图像。

上述方法中，步骤4)可包括：

步骤41)、根据下式对所述规范化后的图像进行全局离散余弦变换(DiscreteCosine Transformation，DCT)操作，以获得变换系数矩阵C(u,v)：

其中，I(x,y)表示所述规范化后的图像，N表示I(x,y)的高度和宽度，并且u,v＝0,1,…,N-1；

步骤42)、对所述变换系数矩阵C(u,v)进行之字形扫描，以将其转换成长度为N×N的一维向量；

将所述长度为N×N的一维向量的左边L/％的系数作为中低频系数，利用密钥key从该中低频系数中随机选择K个位置的系数按顺序组成长度为K的一维向量A＝[a₀,a₁,…,a_K-1]；

根据下式确定特征序列f＝[f₀,f₁,…,f_K-1]中的每一位：

或

其中，i＝0,1,…,K-1。

上述方法中，步骤4)可包括：

步骤41)、采用0填充的方式，将所述规范化后的图像的高度和宽度调整至2的整数次幂M；

步骤42)、根据下式对所述规范化后的图像进行全局DFT操作，以获得变换系数矩阵F(u,v)；

其中，I(x,y)表示所述规范化后的图像，M表示I(x,y)的高度和宽度，u,v＝0,1,…,M-1，

步骤43)、以所述变换系数矩阵F(u,v)的中间位置的低频数据点为中心，将半径为(0.5ML)/％范围内的所有位置上的系数作为中低频系数；

利用密钥key从所述中低频系数中随机选择K个位置的系数按顺序组成长度为K的一维向量A＝[a₀,a₁,…,a_K-1]；

根据所述长度为K的一维向量中各个系数在所述变换系数矩阵F(u,v)中的位置，获得与之相对应的长度为K的一维向量B＝[b₀,b₁,…,b_K-1]，其中系数a_i在所述变换系数矩阵F(u,v)中的位置与系数b_i在所述变换系数矩阵F(u,v)中的位置关于水平轴或竖直轴对称，i＝0,1,…,K-1；

根据下式确定特征序列f＝[f₀,f₁,…,f_K-1]中的每一位：

或

其中，i＝0,1,…,K-1。

上述方法中，步骤4)可包括：

步骤41)、对所述规范化后的图像进行全局奇异值分解(Singular ValueDecomposition，SVD)操作，即寻找满足下式的N阶二维系数矩阵U和N阶二维系数矩阵V：

其中，I表示所述规范化后的图像，Σ＝diag(σ₁,σ₂,…,σ_r)，σ₁≥σ₂≥…≥σ_r＞0表示I的r个特征值，r表示I的秩，O表示零矩阵，N表示I的高度和宽度；

步骤42)、将所述N阶二维系数矩阵U的第p列数据和所述N阶二维系数矩阵V的第p列数据组成长度为2N的一维向量，其中p的取值为对应图像的较大特征值；

利用密钥key从所述长度为2N的一维向量中随机选择K个位置的系数按顺序组成长度为K的一维向量A＝[a₀,a₁,…,a_K-1]；

根据下式确定特征序列f＝[f₀,f₁,…,f_K-1]中的每一位：

或

其中，i＝0,1,…,K-1。

根据本发明的一个实施例，还提供一种数字媒体版权管理方法，包括：

获取数字媒体的版权信息；

采用上述图像特征提取方法，提取所述数字媒体的特征序列；

将所述数字媒体的版权信息与特征序列在数据库中进行对应的登记注册；

利用所述数字媒体的登记注册信息进行所述数字媒体的版权管理。

与现有技术相比，本发明至少具有以下有益效果：

本发明提出了将基于几何不变域的思想和基于图像变换/分解的思想相结合的图像特征提取基本框架，并在此框架的基础之上提出了将改进的图像规范化方法与DCT、DFT和SVD等图像变换/分解方法相结合的图像特征提取方法。通过深入分析传统图像规范化方法的特点及存在的问题，以图像DFT幅值系数的分布规律为基础，提出了改进的图像规范化方法，其中引入了基于DFT幅值系数的旋转角度和缩放比例因子的估计与校正策略，并在图像规范化的不同环节中引入了三次不同目的的缩放操作，使得图像的规范化过程能够适用于更多类型的受攻击图像。同时，在图像特征提取方法中提出的依据图像变换/分解的中低频系数来提取特征序列的策略，可以避开一般的图像处理攻击在改变图像高频分量时对特征信息的影响。

综上，本发明提供的图像特征提取方法在抵抗常见图像处理攻击和几何攻击方面的能力有了显著提高，能够适用于基于图像内容特征的多媒体检索等领域，也能够扩展到基于帧的视频片段匹配与定位等领域，还能够为基于特征提取与登记注册的数字媒体版权管理模式提供一种新的解决方案和途径。

当然，实施本发明的任一产品不一定需要同时实现以上所述的所有优点。

附图说明

附图作为本发明的一部分，用来提供对本发明的进一步的理解。显然，下面描述的附图仅仅是一些实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。其中：

图1为根据一示例性实施例示出的图像特征提取方法的流程图；

图2a为根据一示例性实施例示出的未经过几何变换的原始图像示意图；

图2b为根据一示例性实施例示出的针对图2a所示图像经过DFT后的幅值系数分布示意图；

图3a为根据一示例性实施例示出的逆时针旋转30度后的原始图像示意图；

图3b为根据一示例性实施例示出的针对图3a所示图像经过DFT后的幅值系数分布示意图；

图4a为根据一示例性实施例示出的逆时针旋转30度后再使其纵横比变为1.2×0.8的原始图像示意图；

图4b为根据一示例性实施例示出的针对图4a所示图像经过DFT后的幅值系数分布示意图；

图5为根据一示例性实施例示出的对4×4的二维矩阵进行之字形扫描(Zig-ZagScan)使其转换为一维向量的示意图；

图6a为根据一示例性实施例示出的未经过几何变换的原始图像的示意图；

图6b为根据一示例性实施例示出的针对图6a所示原始图像经过本发明实施例提供的一次尺寸标准化后的示意图；

图6c为根据一示例性实施例示出的针对图6b所示图像经过本发明实施例提供的平移规范化后的示意图；

图6d为根据一示例性实施例示出的针对图6c所示图像经过本发明实施例提供的缩放规范化后的示意图；

图6e为根据一示例性实施例示出的针对图6d所示图像经过本发明实施例提供的旋转规范化后的示意图；

图6f为根据一示例性实施例示出的针对图6e所示图像经过本发明实施例提供的翻转规范化后的示意图；

图6g为根据一示例性实施例示出的针对图6f所示图像经过本发明实施例提供的再次尺寸标准化后的示意图；

图6h为根据一示例性实施例示出的针对图6a所示原始图像经过传统图像规范化后的示意图；

图7a为根据一示例性实施例示出的经过了逆时针30度旋转和1.2×0.8纵横比变化后的原始图像的示意图；

图7b为根据一示例性实施例示出的针对图7a所示原始图像经过本发明实施例提供的缩放校正后的示意图；

图7c为根据一示例性实施例示出的针对图7b所示图像经过本发明实施例提供的旋转校正后的示意图；

图7d为根据一示例性实施例示出的针对图7c所示图像经过本发明实施例提供的一次尺寸标准化后的示意图；

图7e为根据一示例性实施例示出的针对图7d所示图像经过本发明实施例提供的平移规范化后的示意图；

图7f为根据一示例性实施例示出的针对图7e所示图像经过本发明实施例提供的缩放规范化后的示意图；

图7g为根据一示例性实施例示出的针对图7f所示图像经过本发明实施例提供的旋转规范化后的示意图；

图7h为根据一示例性实施例示出的针对图7g所示图像经过本发明实施例提供的翻转规范化后的示意图；

图7i为根据一示例性实施例示出的针对图7h所示图像经过本发明实施例提供的再次尺寸标准化后的示意图；

图7j为根据一示例性实施例示出的针对图7a所示原始图像经过传统图像规范化方法规范化后的示意图；

图8a为根据一示例性实施例示出的原始图像的示意图；

图8b为根据一示例性实施例示出的针对图8a所示原始图像经过质量因子为60％的JPEG压缩后的示意图；

图8c为根据一示例性实施例示出的针对图8a所示原始图像经过3×3的均值滤波后的示意图；

图8d为根据一示例性实施例示出的针对图8a所示原始图像经过3×3的中值滤波后的示意图；

图8e为根据一示例性实施例示出的针对图8a所示原始图像经过均值为0，方差为0.02的高斯噪声后的示意图；

图8f为根据一示例性实施例示出的针对图8a所示原始图像经过能量为0.05的椒盐噪声后的示意图；

图8g为根据一示例性实施例示出的针对图8a所示原始图像将亮度降低为原来的60％后的示意图；

图9a为根据一示例性实施例示出的针对图8a所示原始图像经过水平翻转后的示意图；

图9b为根据一示例性实施例示出的针对图8a所示原始图像经过垂直翻转后的示意图；

图9c为根据一示例性实施例示出的针对图8a所示原始图像经过逆时针旋转30度后的示意图；

图9d为根据一示例性实施例示出的针对图8a所示原始图像经过放缩因子为50％的放缩后的示意图；

图9e为根据一示例性实施例示出的针对图8a所示原始图像经过缩放因子为0.8的缩放后的示意图；

图9f为根据一示例性实施例示出的针对图8a所示原始图像经过纵横比为1.4×0.8的拉伸后的示意图。

这些附图和文字描述并不旨在以任何方式限制本发明的构思范围，而是通过参考特定实施例为本领域技术人员说明本发明的概念。

具体实施方式

下面结合附图以及具体实施例对本发明解决的技术问题、采用的技术方案以及实现的技术效果进行清楚、完整的描述。显然，所描述的实施例仅仅是本申请的一部分实施例，并不是全部实施例。基于本申请中的实施例，本领域普通技术人员在不付出创造性劳动的前提下，所获得的所有其它等同或明显变型的实施例均落在本发明的保护范围内。本发明实施例可以按照权利要求中限定和涵盖的多种不同方式来具体化。

需要说明的是，在下面的描述中，为了方便理解，给出了许多具体细节。但是很明显，本发明的实现可以没有这些具体细节。还需要说明的是，在没有明确限定或不冲突的情况下，本发明中的各个实施例及其中的技术特征可以相互组合而形成技术方案。

根据本发明的一个实施例，提供一种图像特征提取方法，该方法结合了改进的图像规范化与图像变换/分解。

概括而言，该图像特征提取方法包括：判断图像是否经历过几何变换，对经历过几何变换的图像进行校正；对图像进行一次尺寸标准化；对一次尺寸标准化后的图像进行规范化操作(如传统图像规范化操作)以及再次尺寸标准化，得到规范化后的图像；对规范化后的图像提取特征。

下文将参照图1，详细描述该图像特征提取方法实施例的各个步骤(S100-S150)。

步骤S100：对待提取特征的图像的旋转角度和缩放比例因子进行估计。

在对图像提取特征之前，首先需要对图像进行规范化处理。图像规范化的目的在于：将原始图像或经过某种处理攻击或几何攻击后的图像进行几何上的变换，使同一图像的不同几何变形能够被规范化到同样的旋转方向、缩放尺寸、翻转方向等，这样就能够保证原始图像及其经过几何变换后的图像在规范化以后能够保持大致相同，从而可以基本上解决几何攻击对图像的形变带来的影响。

由于传统的图像规范化方法是对输入图像直接做平移规范化、缩放规范化、旋转规范化和翻转规范化，而这样做存在的问题是：如果原始输入图像(尤其是高度和宽度不同的图像)本来就是一幅已经经历过平移、旋转、缩放、甚至是纵横比变化等几何变换后的图像，则对其直接进行传统的规范化操作会带来五花八门的规范化效果，几何变换前后的图像在被规范化后很难实现几何同步。因此，需要在进行传统规范化操作之前，对图像事先是否经历过几何变换进行一定的估计，尤其是旋转和缩放两种攻击及其组合攻击，只有事先对其进行估计和校正，才能更好地实现规范化后的图像的几何同步。

基于上文的分析，步骤S100可包括如下三个子步骤(S101-S103)：

步骤S101：考察图像是否经历过旋转变换，即通过分析图像的全局DFT幅值系数，来判断图像是否经历过旋转变换。

具体过程包括：

1：采用0填充的方式将原始图像填充到固定的尺寸(如N×N，即高度和宽度相同，且是2的整数次幂，以方便DFT的快速运算)。其中，对于原本尺寸较大的图像，可以先采用等尺度缩小的形式将其尺寸缩小到N之内，再进行必要的0填充。

2：对灰度图像的像素矩阵或对彩色图像的亮度矩阵进行全局DFT操作，得到其幅值系数。通过幅值系数的大小分布情况寻找经过矩阵(幅值系数矩阵)中心点的较大幅值系数所在的两条直线，分别计算这两条直线与水平正方向的夹角。

3：若两个夹角为0度或90度，则说明图像没有经历过旋转变换，直接进入步骤S120；否则，说明图像经历过旋转变换，进入步骤S102。

上述过程中，对图像所对应的二维矩阵I(x,y)，x,y＝0,1,…,N-1进行全局DFT操作的具体公式如下：

其中，u,v＝0,1,…,N-1，

需要说明的是，在对图像进行全局DFT操作之前，对图像进行0填充并统一成正方形尺寸是为了使得傅里叶变换域的系数更加平滑，从而有利于后续的系数分析操作。

以图2a、图2b、图3a、图3b、图4a和图4b为例，原始图像(包括经过几何变换后的原始图像)在进行了基于0填充的全局DFT操作后，其幅值系数的分布呈现如下规律：

(1)、在图像未经过几何变换时，其幅值系数的较大值除了出现在矩阵中心的区域之外，还主要出现在经过矩阵中心点的水平和垂直的两条直线上，如图2a和图2b所示(具体参见图2b中的较亮部分)。这里的中心区域的较大幅值系数代表的是图像的低频信息，其包含了图像主要的内容信息；而经过矩阵中心点的幅值系数较大的两条直线则代表了图像周围的突变边缘。

(2)、在图像经过旋转变换后，上述两条相互垂直的直线也会发生相同方向和相同角度的旋转，并且二者仍然保持垂直的关系，如图3a和图3b所示。

(3)、在图像经过旋转变换后，若再经过了高度和宽度方向上的非等尺度的缩放(即图像的纵横比发生变化)，即可以看作图像经过了一般意义的仿射变换，此时这两条系数较大的直线将不再保持垂直关系，但这两条直线与水平正方向的夹角仍然存在某种内在联系，如图4a和图4b所示。

以上结论可以通过理论分析和推导得以证实，此处不再赘述。

步骤S102：考察图像是否经历过非等尺度缩放变换，即通过分析步骤S101中计算得到的两个夹角的关系，来判断图像是否在旋转变换的基础上又经历过非等尺度缩放变换。

具体过程包括：分析步骤S101中计算得到的两个夹角，如果二者呈现90度的差距，则说明图像在经历过旋转变换后，没有经历过非等尺度缩放变换，因此不需要进行缩放比例因子的估计和缩放校正，直接进入步骤S112；否则，说明图像在旋转变换的基础上又经历过非等尺度缩放变换，进入步骤S103。

步骤S103：根据步骤S101中计算得到的两个夹角，计算两个方向的缩放比例因子的比值。

下面首先从理论上分析当图像先后经过旋转变换和非等尺度缩放变换时，DFT幅值系数较大的两条直线之间的夹角关系：

(1)根据理论推导，在图像未经过几何变换的情况下，DFT幅值系数较大的两条直线与水平正方向的角度分别为0度和90度，假设原始图像的高度和宽度分别为H₀和W₀；

(2)根据理论推导，在图像经过逆时针旋转θ角度后(不失一般性，假设θ∈[0,90))，对应的DFT幅值系数较大的两条直线对应的角度分别为θ度和(θ+90)度，假设旋转后图像的高度和宽度分别为H₁和W₁；则有如下关系成立：

(3)对上述旋转后的图像继续进行高度方向因子为α、宽度方向因子为β的缩放，假设缩放后图像的高度和宽度分别为H₂和W₂；则有如下关系成立：

此时，假设对应的DFT幅值系数较大的两条直线与水平正方向的夹角分别为δ₁度和δ₂度(不失一般性，假设δ₁∈[0,90)，δ₂∈[90,180))；令θ₁＝δ₁，θ₂＝δ₂-90，则θ₁,θ₂∈[0,90)；则有如下关系成立：

由此得到：

这里的ρ称为估计出的宽度方向与高度方向缩放比例因子的比值。

上述推导过程应用了DFT的一个重要性质，即当图像经过了缩放因子为σ的等尺度缩放后，其对应的DFT幅值系数矩阵会进行缩放因子为1/σ的等尺度缩放。这一点同样可以通过理论证明得到，此处不再赘述。

由以上推导可知：

当δ₂-δ₁＞90，即θ₁＜θ₂时，缩放比例因子的比值在估计两个方向的缩放因子过程中，可以认为此时是图像的高度不变，宽度增大到以前的1/ρ倍；

当δ₂-δ₁＜90，即θ₁＞θ₂时，缩放比例因子的比值在估计两个方向的缩放因子过程中，可以认为此时是图像的宽度不变，高度增大到以前的ρ倍。

通过以上理论推导，可以基于步骤S101中计算得到的两个夹角值δ₁和δ₂，计算两个方向的缩放比例因子的比值ρ。

步骤S110：对待提取特征的图像进行缩放校正和旋转校正。

具体地，本步骤包括子步骤S111至步骤S112。

步骤S111：根据步骤S103中估计得到的两个方向的缩放比例因子的比值ρ，采用相反的过程对待提取特征的图像进行一次非等尺度缩放来对其进行缩放校正。

其中，采用如下规则进行缩放校正：

(1)当θ₁＝θ₂时，说明图像并未经历过非等尺度缩放变换(当然，有可能经过了旋转或等尺度缩放变换)，则不需要进行缩放校正，其校正过程可以通过后续的缩放规范化操作来完成；

(2)当θ₁＜θ₂时，估计出的缩放比例因子的比值ρ＜1，对图像进行如下的非等尺度缩放变换的校正：图像的高度不变，宽度增大到原来宽带的1/ρ倍；

(3)当θ₁＞θ₂时，估计出的缩放比例因子的比值ρ＞1，对图像进行如下的非等尺度缩放变换的校正：图像的宽度不变，高度增大到原来高度的ρ倍。

步骤S112：对图像进行旋转校正。

此时的图像若经过了步骤S111的缩放校正，则需要重新计算缩放校正后的图像的DFT幅值系数，否则直接采用步骤S101中计算得到的DFT幅值系数即可；根据计算得到的两个夹角值估计图像经过的旋转变换的旋转角度，采用相反方向的旋转过程对图像进行一次旋转来对其进行校正。

步骤S120：对缩放校正和旋转校正后的图像进行一次尺寸标准化。

本步骤将图像缩放到固定的正方形尺寸。这里的尺寸可以事先设定，也可以根据图像本身的尺寸进行动态调整，如将图像的高度和宽度均调整为图像原始高度和宽度中较大的值。应理解，这里的图像来源有两种：一是在步骤S101中发现其未经过旋转变换的图像；二是在步骤S112中经过了旋转校正的图像。

步骤S130：对一次尺寸标准化后的图像依次进行平移规范化、缩放规范化、旋转规范化、翻转规范化和再次尺寸标准化，得到规范化后的图像。

这里的平移规范化、缩放规范化、旋转规范化可采用传统的图像规范化的方法来完成。

应理解，传统的图像规范化方法是基于图像的几何矩和中心矩来完成的。通常用I(x,y)，x＝0,1,…,M-1，y＝0,1,…,N-1来表示一般意义上的二维图像，其中M和N分别表示图像的高度和宽度。图像的中心矩m_pq和几何矩μ_pq分别定义如下：

其中，p和q称为图像矩的阶，其均为不小于0的整数；分别为图像质心的横、纵坐标，其分别定义为：

假设图像I(x,y)经过几何变换后表示为I(x',y')，并且变换前后图像坐标存在如下的对应关系：

这里2×2的矩阵A表示图像经过的仿射变换矩阵，列向量D表示图像经过的平移变换的坐标偏移量。则可以将图像的规范化过程归纳为如下几个步骤，如以下公式所示：

从右至左可依次称为中心化(平移规范化)、缩放规范化和旋转规范化。其中，(x_n,y_n)是图像规范化后的坐标，(x_c,y_c)是图像中心化后的坐标，α、δ表示缩放规范化参数且α,δ∈R；φ表示旋转规范化参数且φ∈[0,2π)。

具体地，本步骤S130可以包括子步骤S131至S135。

步骤S131：对图像进行平移规范化。

平移规范化的目的在于使图像的规范化效果不受平移攻击的影响，因此主要采取的策略是对图像的坐标进行必要的偏移以使其质心与其几何中心重合。

可以依据如下公式计算图像平移规范化后的坐标：

其中，如上文所述，(x,y)为图像的坐标，m为图像的中心矩。

通过平移变换将图像的质心平移到其几何中心的位置，从而完成平移规范化过程。平移规范化后的图像表示为I(x_c,y_c)，图像的高度和宽度分别表示为M_c和N_c。

步骤S132：对图像进行缩放规范化。

缩放规范化的目的在于使图像的规范化效果不受缩放攻击(包括纵横比变化的缩放攻击)的影响，因此，主要采取的策略是通过图像的几何矩来计算图像缩放规范化过程中两个方向上的缩放因子，再依据所述缩放因子进行坐标变换来实现缩放规范化。

其中，利用如下两个几何矩来计算两个方向的缩放因子：

其中，分别表示图像I(x_c,y_c)的质心的横、纵坐标。

根据约束方程取正的缩放因子值为：

利用求得的两个缩放因子值对平移规范化后的图像I(x_c,y_c)进行两个方向的缩放变换，从而完成缩放规范化过程。缩放规范化后的图像表示为I(x_s,y_s)，图像的高度和宽度分别表示为M_s和N_s。

步骤S133：对图像进行旋转规范化。

旋转规范化的目的在于使图像的规范化效果不受旋转攻击的影响，因此，主要采取的策略是通过图像的几何矩来计算图像旋转规范化过程中的旋转角度，再依据所述旋转角度进行图像的旋转变换来实现旋转规范化。

其中，利用如下四个几何矩来计算旋转规范化的旋转角度：

其中，分别表示图像I(x_s,y_s)的质心的横、纵坐标。

根据约束方程可得旋转角度为：

利用求得的旋转角度对缩放规范化后的图像I(x_s,y_s)进行逆向的旋转变换，从而完成旋转规范化过程。旋转规范化后的图像表示为I(x_r,y_r)，图像的高度和宽度分别表示为M_r和N_r。

除了上文描述的平移规范化、缩放规范化、旋转规范化过程以外，在本发明实施例提供的图像特征提取方法中还引入了翻转规范化的过程，目的在于使图像的规范化效果不受翻转攻击的影响。

步骤S134：对图像进行翻转规范化。

翻转规范化主要根据图像的两个单边奇数阶几何矩和的符号来完成，其中d为大于0的奇数：

其中，M_r和N_r分别为当前图像I(x_r,y_r)的高度和宽度，分别表示图像I(x_r,y_r)的质心的横、纵坐标。

以d＝1为例，当图像发生水平方向的翻转时，理论上翻转前后图像的几何矩会发生符号的改变；同理，当图像发生垂直方向的翻转时，理论上翻转前后图像的几何矩会发生符号的改变，翻转规范化的过程正是基于这一原理来设计和实现的。因此，在本步骤中，首先计算经图像的几何矩和若则将图像按垂直方向翻转一次；若则将图像按水平方向翻转一次。其中，若且则将图像按垂直方向翻转一次，并且再按水平方向翻转一次。

总之，图像翻转规范化的目的是将图像的两个单边奇数阶几何矩均变成正数(或均变为负数)，以此完成翻转规范化过程。

通过发明人的实验分析发现，采用一阶几何矩对图像进行翻转规范化的过程稳定性较差，因此，在一个优选的实施例中，可采用五阶矩来实现，即d＝5。需要说明的是，采用五阶矩来实现图像翻转规范化过程并非对本发明的限制，与五阶矩类似，任何能够表示图像翻转特性的图像矩均可以采用并包含在本发明之内。

步骤S135：将经过上述规范化操作后的图像再进行一次尺寸标准化，将其缩放到特定大小的正方形区域内。

在一般情况下，经过步骤S131到步骤S134这四种规范化的过程以后，还对图像再进行一次缩放变换，使不同的规范化图像均能缩放到相同的尺寸上去，这样，在进一步的图像变换或分解过程中能够避免因图像尺寸不同而带来的异步性问题。

基于以上对图像规范化方法的描述与分析，利用上述思路对一般的图像及其几何变换后的图像进行规范化。通过对比规范化前后的图像发现：传统的图像规范化方法针对原始图像是正方形的情况，能够对原始图像及其规则几何形变后的图像进行基本一致的规范化；然而，针对本身是长方形的图像，其原始图像的规范化结果与其几何形变后图像的规范化结果很难达到方向上的一致，主要原因在于长方形图像在进行仿射变换时，往往其图像本身的宽高比会发生比较明显的变化，这就导致在进行旋转规范化等过程中，通过图像本身的几何矩很难校正这种变换形式。

考虑到传统的图像规范化方法在抵抗几何攻击方面存在的不足，本发明提出的基于旋转角度以及缩放比例因子的估计和校正策略，改进了传统的图像规范化方法；同时，需要强调的是，在以上描述的图像规范化方法的不同阶段分别进行了三次图像缩放操作，这三次缩放操作缺一不可：第一次缩放出现在旋转角度以及缩放比例因子的估计与校正之后，真正意义的图像规范化操作(即传统图像规范化操作)之前，这时经过前面若干步操作所得到的图像有可能是长方形图像，为了后续规范化操作的顺利进行并且能抵抗更多类型的几何攻击，这里需要首先将图像缩放成正方形；第二次缩放是真正意义的图像缩放，图像规范化过程中由于存在平移规范化，而平移规范化后的图像其尺寸、宽高比也会发生相应的变化，因此需要一次基于矩的缩放来校正这里的图像失真；第三次缩放出现在图像经过传统规范化之后，这时的图像已经又经历了一次旋转和可能的翻转，由于不同图像旋转的角度可能不同，导致旋转后的图像大小也不同，必须要再经过一次缩放，使所有到达该步骤的图像都能够被缩放到统一的尺寸，方便与该方法配合应用的其他方法的顺利实施。

步骤S140：对规范化后的图像进行图像变换或图像分解。

将经过步骤S130得到的规范化后的图像进行基本的图像变换或图像分解，以获得变换域系数或图像分解系数。如上所述，规范化后的图像可以描述为一个固定大小的二维矩阵，表示为I(x,y)(或简称I)，x,y＝0,1,…,N-1，其中N代表图像的高度和宽度；

本发明实施例提供如下三种能够与上述改进的图像规范化方法相结合的图像变换或图像分解方法：

(1)对规范化后的图像进行全局DCT操作，以获得变换系数矩阵。

具体地，对规范化后的图像I(x,y)进行全局DCT操作的具体公式如下：

其中，并且u,v＝0,1,…,N-1。

通过对N×N的矩阵I(x,y)进行全局DCT操作，获得一个N×N的二维变换系数矩阵C(u,v)。其中，该变换系数矩阵的左上角系数代表图像的低频分量，右下角系数代表图像的高频分量，低频分量携带了更多的图像内容信息，高频分量往往携带的是图像的一些噪声信息，相对来讲，低频分量或偏向于低频的中频分量(通常将二者合称为中低频分量)最能够代表图像的内容信息。

(2)对规范化后的图像I(x,y)进行全局DFT操作，以获得变换系数矩阵。

对二维矩阵I(x,y)进行全局DFT操作的具体公式如下(其中，在进行全局DFT操作之前需要采用0填充的方式将图像高度和宽度均调整至2的整数次幂，以便于DFT的快速运算；这里图像的高度和宽度均表示为M)：

其中，u,v＝0,1,…,M-1，

通过对N×N的二维矩阵I(x,y)进行基于0填充的DFT操作，获得一个M×M的二维变换系数矩阵F(u,v)，该变换系数矩阵的中心区域系数代表图像的低频分量，该变换系数矩阵的外围区域系数代表图像的高频分量，同样地，系数的中低频分量最能够代表图像的内容信息。

(3)对规范化后的图像进行全局SVD操作，以获得分解系数矩阵。

根据《线性代数》和《矩阵论》的一些原理和方法，对二维矩阵I进行SVD操作，即找到一个N阶的二维系数矩阵U和一个N阶的二维系数矩阵V，使得下式成立：

其中，Σ＝diag(σ₁,σ₂,…,σ_r)，σ₁≥σ₂≥…≥σ_r＞0为I的r个特征值，r为I的秩；O代表零矩阵。

更多关于矩阵SVD操作的原理细节此处不再赘述。

通过对N×N的二维矩阵I进行SVD操作，获得一个N×N的二维系数矩阵U和一个N×N的二维系数矩阵V。其中U的每一列以及V的每一列都和I的某个特征值相对应，越大的特征值携带越多的图像能量，因此，两个系数矩阵U和V的相应列向量对表现图像内容信息也越重要。

需要说明的是，本实施例中提供的所述图像变换方法或所述图像分解方法并非对本发明的限制，任何能够与本发明实施例提供的图像规范化方法相结合进行图像鲁棒特征提取的图像变换方法或图像分解方法均可被采用并包含在本发明之内。

步骤S150：分析图像变换或图像分解后的系数分布特征和规律，生成图像稳定的特征序列。

采用步骤S140中获得的图像变换或图像分解后的矩阵，根据所述图像变换或所述图像分解的特性，采用特定的规则生成特定长度(这里假设为K)的图像特征序列f＝[f₀,f₁,…,f_K-1]。本文中，对特征序列的表示一般分为两种：0/1序列和-1/+1序列。

对应于步骤S140提供的三种能够与本发明提供的改进的图像规范化方法相结合的图像变换或图像分解方法，本发明实施例提供如下三种对图像变换系数或图像分解系数进行分析并提取图像稳定特征序列的方法：

(1)对应于步骤S140中提供的基于全局DCT的图像变换方法获得的变换系数矩阵C(u,v)，其中u,v＝0,1,…,N-1，采用如下方法实现图像稳定特征序列的提取：

A：对步骤S140中获得的二维变换系数矩阵C(u,v)进行之字形扫描，将其转换成长度为N×N的一维向量。其中，之字形扫描的方法示意图参见图5。

B：将该长度为N×N的一维向量的左边L/％的系数作为图像的中低频系数，利用密钥key从中低频系数中随机选择K个位置的系数按顺序组成一个长度为K的一维向量A＝[a₀,a₁,…,a_K-1]。其中，选择的顺序由密钥key控制，这里密钥key的设置是为了提高方法的安全性，在方法完全公开的情况下，使用错误的密钥则无法提取出正确的特征序列。

C：根据上述长度为K的一维向量中各个DCT系数的值来确定最终提取出的图像特征序列f＝[f₀,f₁,…,f_K-1]的每一位，一种可行的策略如下：

或

其中，f_i表示提取出的特征序列的第i位，i＝0,1,…,K-1。

至此，通过以上步骤提取出了稳定的图像特征序列。

需要说明的是，本领域技术人员可以理解，本实施例中提供的基于DCT系数的图像特征序列的生成策略并非是对本发明的限制，任何能够利用图像DCT系数生成能够代表其内容的稳定特征序列的方法均包含在本发明之内。

(2)对应于步骤S140中提供的基于全局DFT的图像变换方法获得的变换系数矩阵F(u,v)，其中u,v＝0,1,…,M-1，采用如下方法实现图像稳定特征序列的提取：

A：以矩阵中间位置的低频数据点为中心，取M/2的前L/％的系数点的长度作为半径，将半径为(0.5ML)/％范围内的所有位置上的系数作为图像的中低频系数。

B：利用密钥key从中低频系数中随机选择K个位置的系数按顺序组成一个长度为K的一维向量A＝[a₀,a₁,…,a_K-1]。其中，选择的顺序由密钥key控制，这里密钥key的设置是为了提高方法的安全性，在方法完全公开的情况下，使用错误的密钥无法提取出正确的特征序列。

C：根据上述长度为K的一维向量中各个系数在矩阵F(u,v)中的具体位置，获得与之相对应的另一个长度为K的一维向量B＝[b₀,b₁,…,b_K-1]，其中系数a_i在矩阵F(u,v)中的位置与系数b_i在矩阵F(u,v)中的位置关于水平轴对称(或者关于竖直轴对称)，i＝0,1,…,K-1。

D：根据上述长度为K的两个一维向量A和B中各个DFT系数的值来确定最终提取出的图像特征序列f＝[f₀,f₁,…,f_K-1]的每一位，一种可行的策略如下：

或

其中，f_i表示提取出的特征序列的第i位，i＝0,1,…,K-1。

至此，通过以上步骤提取出了稳定的图像特征序列。

需要说明的是，本领域技术人员可以理解，本实施例中提供的基于DFT系数的图像特征序列的生成策略并非是对本发明的限制，任何能够利用图像DFT系数生成能够代表其内容的稳定特征序列的方法均包含在本发明之内。

(3)对应于步骤S140中提供的基于SVD的图像分解方法获得的分解系数矩阵U和V，采用如下方法实现图像稳定特征序列的提取：

A：将矩阵U的第p列数据以及矩阵V的第p列数据组成一个长度为2N的一维向量，这里p的取值原则为对应图像的较大特征值(中低频分量)，一般p取为0或者接近0的较小整数。

B：利用密钥key从所述长度为2N的一维向量中随机选择K个位置的系数按顺序组成一个长度为K的一维向量A＝[a₀,a₁,…,a_K-1]。其中，选择的顺序由密钥key控制，这里密钥key的设置是为了提高方法的安全性，在方法完全公开的情况下，使用错误的密钥无法提取出正确的特征序列。

C：根据上述长度为K的一维向量中各个SVD系数的值来确定最终提取出的图像特征序列f＝[f₀,f₁,…,f_K-1]中的每一位，一种可行的策略如下：

或

其中，f_i表示提取出的特征序列的第i位，i＝0,1,…,K-1。

至此，通过以上步骤提取出了稳定的图像特征序列。

需要说明的是，本领域技术人员可以理解，本实施例中提供的基于SVD的图像特征序列的生成策略并非是对本发明的限制，任何能够利用图像SVD系数生成能够代表其内容的稳定特征序列的方法均包含在本发明之内。

另外需要说明的是，本领域技术人员可以理解，本实施例中提供的对图像变换系数或图像分解系数进行分析并提取图像稳定特征序列的方法并非是对本发明的限制，任何能够适用于表示图像内容和特征的系数分析方法与特征序列提取方法均可采用并包含在本发明之内。

下面根据两个示例详细说明本发明提供的图像特征提取方法在图像规范化阶段的特点和优势。

示例一：以图6a-图6h、图7a-图7j为例对上述方法进行详细说明。

如图6a所示，选取尺寸为816×616的原始图像作为待规范化的图像，经过如下步骤和处理：

步骤S201：通过对图6a所示的图像进行全局DFT操作并分析DFT幅值系数，考察图像是否经历过旋转变换。基于0填充的DFT操作将填充后的图像尺寸设置为1024×1024，通过分析计算经过幅值系数矩阵中心点的系数值较大的两条直线与水平正方向的夹角分别为0度和90度，说明图像没有经历过旋转变换。

步骤S202：对图6a所示的图像进行一次尺寸标准化，这里根据一次尺寸标准化之前的图像尺寸，将一次尺寸标准化后图像的尺寸灵活地设置为816×816，如图6b所示。

步骤S203：对图6b所示的图像进行平移规范化。计算得到上述一次尺寸标准化图像的质心坐标为(365，432)，对应的平移后的图像尺寸为864×902，如图6c所示。

步骤S204：对图6c所示的图像进行缩放规范化。计算得到两个方向的缩放因子的比值为1.17，缩放后的图像尺寸为864×1059，如图6d所示。

步骤S205：对图6d所示的图像进行旋转规范化。计算得到图像的旋转角度为-85度，对图像进行85度的顺时针旋转，如图6e所示。

步骤S206：对图6e所示的图像进行翻转规范化。计算得到水平方向和垂直方向的五阶几何矩均小于0，分别各进行一次水平翻转和一次垂直翻转，使两个方向的五阶矩均为正数，如图6f所示。

步骤S207：将图6f所示规范化后的图像缩放成固定大小的尺寸。这里最终规范化的图像尺寸设置为512×512，如图6g所示。

步骤S208：为突出本发明中提供的图像规范化方法的技术优势，选择传统的图像规范化方法对图6a所示的图像进行一次规范化，得到规范化后的图像如图6h所示。

示例二：如图7a所示，选取尺寸为816×616的原始图像经过逆时针30度的旋转变换以及1.2×0.8的纵横比变换后的图像作为待规范化的图像，尺寸为1219×754，经过如下步骤和处理：

步骤S301：通过对图7a所示的图像进行全局DFT操作并分析DFT幅值系数，考察图像是否经历过旋转变换。基于0填充的DFT操作将填充后的图像尺寸设置为1024×1024，通过分析计算经过矩阵中心点的系数值较大的两条直线与水平正方向的夹角分别为41度和111度，说明图像经历过旋转变换。

步骤S302：通过分析步骤S301估计得到的两个角度值，二者差距为70度，并非90度，说明图像在旋转变换的基础上又经历过非等尺度缩放变换。

步骤S303：根据步骤S301估计得到的两个角度值，计算得到宽度与高度方向的缩放比例因子的比值为1.50。

步骤S304：依据步骤S303计算得到的缩放比例因子的比值，对图7a所示的图像进行缩放校正，校正后图像的尺寸为1219×1135，如图7b所示。

步骤S305：对图7b所示的图像重新计算并分析DFT幅值系数，得到图像经历旋转变换的旋转角度为120度，对其进行顺时针120度的旋转变换得到旋转校正后的图像，尺寸为748×986，如图7c所示。

步骤S306：对图7c所示的图像进行一次尺寸标准化，这里根据一次尺寸标准化之前的图像尺寸，将一次尺寸标准化后图像的尺寸灵活地设置为986×986，如图7d所示。

步骤S307：对图7d所示的图像进行平移规范化。计算得到上述一次尺寸标准化图像的质心坐标为(521，544)，对应的平移后的图像尺寸为1088×1042，如图7e所示。

步骤S308：对图7e所示的图像进行缩放规范化。计算得到两个方向的缩放因子的比值为0.85，缩放后的图像尺寸为1088×890，如图7f所示。

步骤S309：对图7f所示的图像进行旋转规范化。计算得到图像的旋转角度为4度，对图像进行4度的逆时针旋转，如图7g所示。

步骤S310：对图7g所示的图像进行翻转规范化。计算得到水平方向和垂直方向的五阶几何矩均小于0，分别各进行一次水平翻转和一次垂直翻转，使两个方向的五阶矩均为正数，如图7h所示。

步骤S311：将图7h所示规范化后的图像缩放成固定大小的尺寸。这里最终规范化的图像尺寸设置为512×512，如图7i所示。

步骤S312：为突出本发明中提供的图像规范化方法的技术优势，选择传统的图像规范化方法对图7a所示的图像进行一次规范化，得到规范化后的图像如图7j所示。

根据以上两个示例，配合附图可以看出，通过对比图6g和图7i以及对比图6h和图7j可以发现，本发明实施例提供的图像规范化方法对几何变换前后的图像进行规范化的效果相同，而传统图像规范化方法对几何变换前后的图像进行规范化的效果差异很大，不能从根本上解决对几何变换后图像的内容异步问题。

下面根据一个示例来详细说明本发明提供的基于改进的图像规范化与图像变换/分解相结合的图像特征提取方法。

以图8a-图8g以及图9a-图9f为例对上述方法进行详细说明。

步骤S401：采用本发明提供的图像规范化方法对图8a所示的原始图像进行规范化处理，得到规范化后的图像，图像尺寸为512×512。

步骤S402：对步骤S401得到的规范化后的图像进行全局DCT操作。

步骤S403：对步骤S402得到的图像DCT系数进行从左上角到右下角的之字形扫描，得到长度为512×512的一维向量；从一维向量的左侧开始，选择前15％-20％位置上的中低频系数作为备选系数；自行设置密钥key，通过key的控制从备选系数中选择128个系数，并根据这128个系数与0的大小关系来逐位确定图像的特征序列。

图8b-8g示例性地示出了本发明实施例中图8a示出的原始图像经过图像处理攻击后的图像。其中，图8b为经过质量因子为60％的JPEG压缩后的图像；图8c为经过3×3的均值滤波后的图像；图8d为经过3×3的中值滤波后的图像；图8e为经过均值为0，方差为0.02的高斯噪声后的图像；图8f为经过能量为0.05的椒盐噪声后的图像；图8g为将亮度降低为原来的60％后的图像。

图9a-9f示例性地示出了本发明实施例中图8a示出的原始图像经过几何攻击后的图像。其中，图9a为经过水平翻转后的图像；图9b为经过垂直翻转后的图像；图9c为经过逆时针旋转30度后的图像；图9d为经过放缩因子为50％的放缩后的图像；图9e为经过缩放因子为0.8的缩放后的图像；图9f为经过纵横比为1.4×0.8的拉伸后的图像。

可以采用本发明实施例提供的基于图像规范化和DCT的图像特征提取方法对以上各个图像的特征序列进行提取，并比较从受攻击的图像中提取出的特征序列与从原始图像中提取出的特征序列的归一化汉明距离(Normalized Hamming Distance，NHD)。归一化汉明距离越小，特征序列之间的差异性越小，特征提取方法的鲁棒性越强。两个特征序列之间归一化汉明距离的计算方法如下：

其中：A＝[a₀,a₁,…,a_K-1]和B＝[b₀,b₁,…,b_K-1]为两个长度均为K的一维特征序列，并且a_i,b_i∈{0,1}，i＝0,1,…,K-1。根据NHD的定义，两个特征序列的NHD值不小于0且不大于1。

利用本发明提供的图像特征提取方法从经过图像处理攻击后的图像中提取出各自的特征序列，并与从原始图像中提取出的特征序列进行比对，得到NHD值如表一所示：

表一：

攻击类型	图8b	图8c	图8d	图8e	图8f	图8g
							NHD	0.11	0.02	0.04	0.09	0.05	0.03

其中，攻击类型一栏所示的图号为该图号所对应的示图所受到的攻击的类型。

利用本发明提供的图像特征提取方法的实施例从经过几何攻击后的图像中提取出各自的特征序列，并与从原始图像中提取出的特征序列进行比对，得到NHD值如表二所示：

表二：

攻击类型	图9a	图9b	图9c	图9d	图9e	图9f
							NHD	0.00	0.00	0.02	0.01	0.01	0.02

根据本发明的一个实施例，还提供一种数字媒体版权管理方法。该方法包括：

获取数字媒体的版权信息。其中，数字媒体可以是文本、图像、音频、视频等。

使用本发明提供的上述图像特征提取方法，对数字媒体进行稳定特征序列的提取；

将数字媒体的版权信息与提取出的稳定特征序列在数据库中进行对应的登记注册；

利用数字媒体的登记注册信息进行所述数字媒体的版权管理。其中，版权管理的方式可以包括对外提供数字媒体登记信息的查询验证服务、登记注册信息的检索比对服务、基于登记注册信息的版权追踪服务等等。

有关本实施例的说明可参见其他实施例，在此不再赘述。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述，但是本领域技术人员可以理解，为了实现本实施例的效果，不同的步骤之间不必按照这样的次序执行，其可以同时(并行)执行或以颠倒的次序执行，这些简单的变化都在本发明的保护范围之内。

本发明实施例具有较好的安全性以及特征的鲁棒性，能抵抗常见的图像处理攻击和几何攻击，可应用于基于内容的图像检索领域以及图像版权保护与版权管理领域，也可据此思路，将其引入到视频中，用于实现基于帧的内容特征提取与检索、视频片段匹配与定位以及视频版权保护与版权管理。

以上对本发明实施例所提供的技术方案进行了详细的介绍。虽然本文应用了具体的个例对本发明的原理和实施方式进行了阐述，但是，上述实施例的说明仅适用于帮助理解本发明实施例的原理；同时，对于本领域技术人员来说，依据本发明实施例，在具体实施方式以及应用范围之内均会做出改变。

需要说明的是，本文中涉及到的流程图或框图不仅仅局限于本文所示的形式，其还可以进行划分和/或组合。

需要说明的是，附图中的标记和文字只是为了更清楚地说明本发明，不视为对本发明保护范围的不当限定。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

本发明的各个步骤可以用通用的计算装置来实现，例如，它们可以集中在单个的计算装置上，例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备或者多处理器装置，也可以分布在多个计算装置所组成的网络上，它们可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。因此，本发明不限于任何特定的硬件和软件或者其结合。

本发明提供的方法可以使用可编程逻辑器件来实现，也可以实施为计算机程序软件或程序模块(其包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件或数据结构等等)，例如根据本发明的实施例可以是一种计算机程序产品，运行该计算机程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质，该介质上包含计算机程序逻辑或代码部分，用于实现所述方法。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可以从计算机主体上拆卸下来的可移动介质(例如：采用热插拔技术的存储设备)。所述内置介质包括但不限于可重写的非易失性存储器，例如：RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于：光存储介质(例如：CD－ROM和DVD)、磁光存储介质(例如：MO)、磁存储介质(例如：磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如：存储卡)和具有内置ROM的媒体(例如：ROM盒)。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种图像特征提取方法，包括：

步骤4)、对所述规范化后的图像提取特征。

2.根据权利要求1所述的方法，其中，步骤1)包括：

3.根据权利要求2所述的方法，其中，步骤11)包括：

步骤111)、采用0填充的方式将所述图像填充为具有第一正方形尺寸的图像，对其进行全局DFT操作以得到其幅值系数；

4.根据权利要求3所述的方法，其中，步骤12)包括：

5.根据权利要求3或4所述的方法，其中，步骤13)包括：

ρ = \frac{β}{α} = \sqrt{\frac{{tanθ}_{1}}{{tanθ}_{2}}}

步骤132)、当θ₁＜θ₂时，使所述图像的高度不变，宽度增大到原宽度的1/ρ倍；当θ₁>θ₂时，使所述图像的宽度不变，高度增大到原高度的ρ倍。

6.根据权利要求3或4所述的方法，其中，步骤14)包括：

7.根据权利要求1-4中任一项所述的方法，其中，步骤2)包括：

根据第二正方形尺寸缩放所述图像，得到一次尺寸标准化后的图像。

8.根据权利要求1-4中任一项所述的方法，其中，步骤3)包括：

对所述一次尺寸标准化后的图像依次进行平移规范化、缩放规范化、旋转规范化、翻转规范化和再次尺寸标准化，得到规范化后的图像。

9.根据权利要求8所述的方法，在步骤3)中，对所述一次尺寸标准化后的图像进行平移规范化包括：

\{\begin{matrix} x_{c} = x - \overset{&OverBar;}{x} = x - m_{10} / m_{00} \\ y_{c} = y - \overset{&OverBar;}{y} = y - m_{01} / m_{00} \end{matrix}

10.根据权利要求9所述的方法，在步骤3)中，所述缩放规范化包括：

\{\begin{matrix} α = \sqrt{1 / μ_{20}^{c}} \\ δ = \sqrt{1 / μ_{02}^{c}} \end{matrix}

11.根据权利要求10所述的方法，在步骤3)中，所述旋转规范化包括：

根据下式计算所述缩放规范化后的图像I(x_s,y_s)的旋转角度：

θ = \arctan (- \frac{(μ_{30}^{s} + μ_{12}^{s})}{(μ_{03}^{s} + μ_{21}^{s})})

12.根据权利要求11所述的方法，在步骤3)中，所述翻转规范化包括：

步骤a)、根据下式计算所述旋转规范化后的图像I(x_r,y_r)的单边奇数阶几何矩和d为大于0的奇数：

μ_{p q}^{r} = Σ_{x_{r} = 0}^{M_{r} - 1} Σ_{y_{r} = 0}^{N_{r} - 1} {(x_{r} - \overset{&OverBar;}{x_{r}})}^{p} {(y_{r} - \overset{&OverBar;}{y_{r}})}^{q} I (x_{r}, y_{r})

步骤c)、得到翻转规范化后的图像。

13.根据权利要求12所述的方法，在步骤3)中，所述再次尺寸标准化包括根据第三正方形尺寸缩放所述翻转规范化后的图像。

14.根据权利要求1-4中任一项所述的方法，其中，步骤4)包括：

步骤41)、根据下式对所述规范化后的图像进行全局DCT操作，以获得变换系数矩阵C(u,v)：

C (u, v) = h (u) h (v) Σ_{x = 0}^{N - 1} Σ_{y = 0}^{N - 1} I (x, y) \cos \frac{(2 x + 1) π u}{2 N} \cos \frac{(2 y + 1) π v}{2 N}

根据下式确定特征序列f＝[f₀,f₁,…,f_K-1]中的每一位：

或

其中，i＝0,1,…,K-1。

15.根据权利要求1-4中任一项所述的方法，其中，步骤4)包括：

F (u, v) = Σ_{x = 0}^{M - 1} Σ_{y = 0}^{M - 1} I (x, y) e^{- j (2 π / M) u x} e^{- j (2 π / M) v y}

根据下式确定特征序列f＝[f₀,f₁,…,f_K-1]中的每一位：

或

其中，i＝0,1,…,K-1。

16.根据权利要求1-4中任一项所述的方法，其中，步骤4)包括：

步骤41)、对所述规范化后的图像进行全局SVD操作，即寻找满足下式的N阶二维系数矩阵U和N阶二维系数矩阵V：

U^{T} \cdot I \cdot V = [\begin{matrix} Σ & O \\ O & O \end{matrix}]

其中，I表示所述规范化后的图像，Σ＝diag(σ₁,σ₂,…,σ_r)，σ₁≥σ₂≥…≥σ_r>0表示I的r个特征值，r表示I的秩，O表示零矩阵，N表示I的高度和宽度；

根据下式确定特征序列f＝[f₀,f₁,…,f_K-1]中的每一位：

或

其中，i＝0,1,…,K-1。

17.一种数字媒体版权管理方法，包括：

获取数字媒体的版权信息；

采用如权利要求1至22中任一项所述的方法，提取所述数字媒体的特征序列；