CN112183585B - 一种基于多特征测度的青铜器铭文相似性度量方法 - Google Patents
一种基于多特征测度的青铜器铭文相似性度量方法 Download PDFInfo
- Publication number
- CN112183585B CN112183585B CN202010933921.9A CN202010933921A CN112183585B CN 112183585 B CN112183585 B CN 112183585B CN 202010933921 A CN202010933921 A CN 202010933921A CN 112183585 B CN112183585 B CN 112183585B
- Authority
- CN
- China
- Prior art keywords
- feature
- inscription
- bronze
- image
- bronze ware
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229910000906 Bronze Inorganic materials 0.000 title claims abstract description 122
- 239000010974 bronze Substances 0.000 title claims abstract description 122
- KUNSUQLRTQLHQQ-UHFFFAOYSA-N copper tin Chemical compound [Cu].[Sn] KUNSUQLRTQLHQQ-UHFFFAOYSA-N 0.000 title claims abstract description 122
- 238000005259 measurement Methods 0.000 title claims abstract description 22
- 238000000691 measurement method Methods 0.000 title claims abstract description 13
- 238000011524 similarity measure Methods 0.000 claims abstract description 20
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 34
- 230000001133 acceleration Effects 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 23
- 230000000007 visual effect Effects 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/435—Computation of moments
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多特征测度的青铜器铭文相似性度量方法,利用非局部均值滤波对青铜器铭文图像去噪,建立数据集;通过提取Hu矩特征描述子与SURF特征矩阵,同时获取铭文的全局与局部特征;并且利用K‑means算法及加权策略对局部SURF特征进行聚类加权,进一步增强显著局部特征剔除冗余信息;最后设定两种测度的权重,形成多相似性度量,有效提高了青铜器铭文的检索精度。更适于进行青铜器铭文的检索。
Description
技术领域
本发明属于信息技术领域,涉及古文字识别,特别涉及一种基于多特征测度的青铜器铭文相似性度量方法。
背景技术
青铜器铭文又称金文、钟鼎文,指铸刻在青铜器物上的文字,是最有代表性的古文字之一,它为研究古代历史文化和古文字提供了重要参考资料。青铜器铭文的隶定工作主要依靠人工进行,需要研究者具备丰富的知识经验,隶定过程需要将未知青铜器铭文图像与已隶定青铜器铭文图像逐一比对,仅依靠人工进行,工作量巨大且容易导致误识。
随着信息技术的发展,青铜器铭文的隶定工作逐渐变得智能化、数字化。青铜器铭文数量多、字形复杂、变体繁多,对铭文进行相似性度量,对于青铜器铭文图像的隶定具有重要意义。
发明内容
本发明的目的在于,提供一种多特征测度的青铜器铭文相似性度量方法。
为了实现上述任务,本发明采用如下的技术解决方案:
一种基于多特征测度的青铜器铭文相似性度量方法,其特征在于,包括以下步骤:
步骤一,利用非局部均值滤波算法,对采集的青铜器铭文图像数据去噪处理,建立青铜器铭文图像数据集;
步骤二,使用Hu不变矩算法提取青铜器铭文的7阶Hu矩,构造青铜器铭文的全局形状特征向量;
步骤三,利用加速鲁棒特征算法提取青铜器铭文的局部加速鲁棒特征向量,并利用K均值聚类算法对加速鲁棒特征进行聚类,利用加权策略,进一步剔除冗余信息;
步骤四,将步骤二中的铭文全局Hu矩特征向量与步骤三中的聚类加权的加速鲁棒特征进行融合,形成多相似性度量对青铜器铭文进行检索。
根据本发明,步骤一中所述利用非局部均值滤波算法,对采集的青铜器铭文图像去噪处理的其具体过程为:
假设青铜器铭文图像ν{ν(α)|α∈I},I为图像的坐标域,对于其中一个像素α,使用非局部平均的方法计算图像中其余所有像素的加权平均值,来得到该像素点的估计值,即
其中,权值由α与β之间的相似性计算得到,并需满足条件:像素α与β的相似性由其相对应的灰度值向量Να与Νβ的相似性得到;Να,Νβ表示以像素α和β为中心选取固定大小的邻域矩阵,各邻域灰度值向量之间的相似性根据高斯加权的欧式距离衡量如公式(2)所示:
式中,α>0,是高斯核函数的标准差;
权重的选取是根据不同像素间的相似性,将邻域像素加权得一个近似值,相似度越高的邻域矩阵向量,加权平均时对应像素点权值越大,权重的计算公式为:
其中,Z(α)为归一化系数,h为平滑参数,控制高斯函数的衰减程度;
经过非局部均值滤波之后的图像,噪声点得到有效去除的同时青铜器铭文的几何结构信息得到增强。
步骤二中所述的提取Hu矩特征作为青铜器铭文全局形状特征向量的具体过程为:
设一幅青铜器铭文图像f(x,y),其(p+q)阶矩定义为:
中心距定义为:
其中,p,q=0,1,2,3…,矩心为图像边缘的质心位置,中心距μpq具有位移不变性;矩心计算如下式所示:
其中,m00为图像的0阶几何矩,m10和m01为图像的两个1阶几何矩,由此可以构造出归一化的中心矩,则归一化中心矩定义为:
其中,
利用二阶和三阶归一化中心距能够得到7个Hu不变矩,即:
φ1=η20+η02
φ3=(η30-3η12)2+(3η21-η03)2
φ4=(η30+η12)2+(η21+η03)2
φ5=(η30-3η12)(η30+η12)[(η30+η03)2-3(η21+η03)]+(3η21-η03)(η21+η03)[3(η30+η21)2-(η21+η03)2]
φ6=(η20-η02)[(η30+η12)2-(η21+η03)2]+4η11(η30+η12)(η21+η03)
为了使不变矩的值对结果识别的贡献增大并缩小数据偏差,对上式中的值用取对数的方式进行修正如下:
Φi=|lg(|φi|)|i=1,2,…7 (10)
最后,得到青铜器铭文的Hu矩特征向量为:
FHu=[Φ1,Φ2,Φ3,Φ4,Φ5,Φ6,Φ7] (11)。
步骤三中所述提取利用加速鲁棒特征算法提取青铜器铭文局部加速鲁棒特征的具体过程为:
1)青铜器铭文特征点检测
二阶导数矩阵是加速鲁棒特征算法的核心,加速鲁棒特征算法采用二阶导数矩阵的行列式近似确定特征点的尺度和位置等信息;
假设青铜器铭文图像I中给定点Ρ=(x,y),定义在尺度σ上的图像二阶导数矩阵为:
式中,Sxx(Ρ,σ),Sxy(Ρ,σ),Syx(Ρ,σ),Syy(Ρ,σ),是图像在点Ρ处的高斯二阶微分的卷积;
为了提高运算速度与鲁棒性,采用盒式滤波近似值代替二次高斯卷积值,同时为减少近似值与准确值的误差,引入了一个加权参数,权值为0.9,因此二阶导数矩阵的判别式为:
Δ(Hes)=Sxx·Syy-(0.9·Sxy)2 (13)
采用3×3×3线性插值法,计算偏移量去除有偏差的点获取特征点的精确定位;
2)确定主方向
为了保证图像特征的旋转不变性,以特征点为中心,半径为6s的圆形邻域内计算图像在x和y方向的哈尔小波响应,其中s为特征点所在的尺度,根据对应位置赋权值,越近权值较大;然后通过将60度的扇形邻域内的所有哈尔小波响应叠加,得到一个新的矢量,遍历整个圆形邻域,得到一个最长的矢量,以该矢量的方向作为特征点的主方向;
3)生成加速鲁棒特征点描述子
确定特征点的主方向后,在关键点周围选取一个边长为20s的正方形窗口同时该方形区域与关键点的主方向平行;然后将该方形区域划分成4×4的子区域,以模板为2×2的哈尔小波计算每个子区域中像素点在水平和垂直方向上的4个小波特征,分别为水平方向和∑wx,水平方向绝对值之和∑|wx|,垂直方向∑wy,垂直方向绝对值之和∑|wy|;这样每个4×4的子区域都有一个4维描述子,最终得到4×(4×4)=64维的加速鲁棒特征描述子。
步骤三中所述提取青铜器铭文局部加速鲁棒特征向量进行聚类加权的具体过程为:
1)选择网格对青铜器铭文图像的加速鲁棒特征进行特征点定位,将其作为视觉单词,然后根据K均值聚类算法算法进行聚类,得到K个类心,每个类心代表对应特征的视觉词汇,一幅青铜器铭文图像就可以得到K×64维的视觉词典:
Ddic=[D1,D2,…,Dk] (14)
2)由于同一青铜器铭文类别中出现频率较高的特征词汇,在其他类别中出现频率较低,根据局部加速鲁棒特征在不同青铜器铭文类别中的重要性不同,利用词频-逆文件频率加权的策略,将视觉词典Ddic中每个特征词汇赋以权值,用聚类加权的视觉特征表示青铜器铭文图像,词频为局部特征词权重公式定义为:
式中,z(λ,j)是特征词λ在青铜器铭文图像特征文件j中出现的次数,∑iz(λi,j)是特征词λ在该文件的总数;逆文件频率为全局特征词权重,公式表示为:
式中,J为所有青铜器铭文特征文件总数,jλ是文件库中包含特征词汇λ的特征文件的总数;当很多特征文件都包含某个词汇时,idf值较小,反之,只在较少文件中出现的特征词汇idf值相对较大,它能有效地表明不同特征词的重要程度。
综合考虑特征词汇在单个特征文件中出现的频率和该词在所有文件集中的逆文件频率得到词频-逆文件频率的计算公式为:
T=tf×idf (17)
在一幅青铜器铭文图像中某一个特征词汇出现频率较高,在其他图像中出现次数很低,得到词频-逆文件频率较高,表明该特征词汇具有较高的类别区分能力;
将上式(17)得到的权重值乘以对应视觉特征词向量作为青铜器铭文的局部特征描述,其表示为
FTF-KSURF=[B1,B2,…Bk] (18)。
步骤四中所述全局Hu矩相似性测度与聚类加权的加速鲁棒特征相似性测度进行融合形成多相似性度量,具体过程为:
1)Hu矩相似性测度:对于两幅进行青铜器铭文图像,设q为查询青铜器铭文图像,l为数据集中的一幅青铜器铭文图像,基于全局Hu矩形状特征的全局相似性测度计算公式为:
式中,Qi为7阶Hu矩对应的权重,根据不同阶数的重要性分配不同的权重,低阶矩更描述青铜器铭文图像的整体形状轮廓,高阶矩描述青铜器铭文图像的结构细节,选取对应权重为:
Qi=[0.3,0.25,0.2,0.1,0.05,0.05,0.05] (20)
2)聚类加权的加速鲁棒特征相似性测度:
基于局部聚类加权的加速鲁棒特征的局部相似性测度的计算公式为:
根据两种特征测度对青铜器铭文图像检索结果的影响,将两种测度进行加权融合,得到多相似性度量公式:
SHu-TFS=ρSimHu+γSimTF-KSURF (22)
式中,ρ和γ分别是两种测度对应的权重系数,ρ+γ=1。
本发明的基于多特征测度的青铜器铭文相似性度量方法,利用Hu矩算法,构造青铜器铭文全局形状特征向量;利用SURF算法提取青铜器铭文的局部显著特征,并利用K均值聚类及加权策略生成TF-KSURF视觉特征向量,进一步增强特征的可区分特性;将Hu矩全局相似性测度与局部TF-KSURF相似性测度进行加权融合,生成用于青铜器铭文图像的相似性度量进行青铜器铭文图像检索识别,有效提高了青铜器铭文的检索精度。明显优于目前的单一测度方法,更适于进行青铜器铭文的检索。
附图说明
图1是青铜器铭文图像非局部均值滤波前后对比图;
图2是三种算法查准率对比曲线图;
图3是三种算法查全率对比曲线图;
以下结合附图和实施例对本发明作进一步详细的描述。
具体实施方式
需要说明的是,在以下的实施例中,所述的英文名词,其中文含义如下:
Hu矩:Hu矩;
SURF:Speeded Up Robust Features,加速鲁棒特征;
means:K均值聚类算法;
TF:Term Frequency,词频;
IDF:Inverse Document Frequency,逆文件频率;
TF-IDF:词频-逆文件频率;
Hessian矩阵:二阶导数矩阵;
box filters:盒式滤波;
Harr:哈尔小波;
TF-KSURF:聚类加权的加速鲁棒特征。
本实施例给出一种基于多特征测度的青铜器铭文相似性度量方法,包括以下步骤:
步骤1,利用非局部均值滤波算法,对采集的青铜器铭文图像进行去噪,在去除图像噪声的同时能够保留完整的青铜器铭文形体结构信息,从而建立青铜器铭文图像数据集,其具体步骤为:
假设青铜器铭文图像ν{ν(α)|α∈I},I为图像的坐标域,对于其中一个像素α,使用非局部平均的方法计算图像中其余所有像素的加权平均值,来得到该像素点的估计值,即
其中,权值由α与β之间的相似性计算得到,并需满足条件:像素α与β的相似性由其相对应的灰度值向量Να与Νβ的相似性得到,Να,Νβ表示以像素α和β为中心选取固定大小的邻域矩阵,各邻域灰度值向量之间的相似性根据高斯加权的欧式距离衡量如公式(2)所示。
式中,α>0,是高斯核函数的标准差。
权重的选取是根据不同像素间的相似性,将邻域像素加权得一个近似值,相似度越高的邻域矩阵向量,加权平均时对应像素点权值越大,权重的计算公式为:
其中,Z(α)为归一化系数,h为平滑参数,控制高斯函数的衰减程度。
由图1看出,经过非局部均值滤波之后的图像,噪声点得到有效去除的同时青铜器铭文的几何结构信息得到增强。
步骤2,使用Hu不变矩算法提取青铜器铭文的7阶Hu矩,构造青铜器铭文的全局形状特征向量,具体步骤为:
对于一幅青铜器铭文图像f(x,y),其(p+q)阶矩定义为:
中心距定义为:
p,q=0,1,2,3…
其中,矩心为图像边缘的质心位置,中心距μpq具有位移不变性。矩心计算公式:
其中,m00为图像的0阶几何矩,m10和m01为图像的两个1阶几何矩。由此可以构造出归一化的中心矩,则归一化中心矩定义为:
其中,
利用二阶和三阶归一化中心距能够得到7个Hu不变矩,即:
φ1=η20+η02
φ3=(η30-3η12)2+(3η21-η03)2
φ4=(η30+η12)2+(η21+η03)2
φ5=(η30-3η12)(η30+η12)[(η30+η03)2-3(η21+η03)]+(3η21-η03)(η21+η03)[3(η30+η21)2-(η21+η03)2]
φ6=(η20-η02)[(η30+η12)2-(η21+η03)2]+4η11(η30+η12)(η21+η03)
为了使不变矩的值对结果识别的贡献增大并缩小数据偏差,对上式中的值用取对数的方式进行修正如下:
Φi=|lg(|φi|)|i=1,2,…7 (10)
最后,得到青铜器铭文的Hu矩特征向量为:
FHu=[Φ1,Φ2,Φ3,Φ4,Φ5,Φ6,Φ7] (11)
步骤3,利用加速鲁棒特征(Speeded Up Robust,SURF)算法提取青铜器铭文的局部特征,由于提取的SURF特征数据较大,为了降低特征数据计算量,利用K-means算法对相似特征进行特征聚类,为进一步增加特征的区分性,引入加权策略,从而构建聚类加权的青铜器铭文SURF视觉特征向量;
构建青铜器铭文的聚类加权的SURF视觉特征向量具体步骤为:
3.1)提取SURF特征
3.1a)特征点检测:Hessian矩阵是SURF算法的核心,SURF算法采用Hessian矩阵的行列式近似确定特征点的尺度和位置等信息。假设青铜器铭文图像I中给定点Ρ=(x,y),定义在尺度σ上的图像Hessian矩阵为:
式中Sxx(Ρ,σ),Sxy(Ρ,σ),Syx(Ρ,σ),Syy(Ρ,σ),是图像在点Ρ处的高斯二阶微分的卷积。
为了提高运算速度与鲁棒性,采用盒式滤波(box filters)近似值代替二次高斯卷积值,同时为减少近似值与准确值的误差,引入了一个加权参数,权值为0.9,因此Hessian矩阵的判别式为:
Δ(Hes)=Sxx·Syy-(0.9·Sxy)2 (13)
采用3×3×3线性插值法,计算偏移量去除有偏差的点获取特征点的精确定位。
3.1b)确定主方向:为了保证图像特征的旋转不变性,以特征点为中心,半径为6s的圆形邻域内计算图像在x和y方向的Harr小波响应,其中s为特征点所在的尺度,根据对应位置赋权值,越近权值较大;然后通过将60度的扇形邻域内的所有Harr小波响应叠加,得到一个新的矢量,遍历整个圆形邻域,得到一个最长的矢量,以该矢量的方向作为特征点的主方向。
3.1c)生成SURF特征点描述子:确定特征点的主方向后,在关键点周围选取一个边长为20s的正方形窗口(s是该关键点所在的尺度)同时该方形区域与关键点的主方向平行;然后将该方形区域划分成4×4的子区域,以模板为2×2的Haar小波计算每个子区域中像素点在水平和垂直方向上的4个小波特征,分别为水平方向和∑wx,水平方向绝对值之和∑|wx|,垂直方向∑wy,垂直方向绝对值之和∑|wy|。这样每个4×4的子区域都有一个4维描述子,最终得到4×(4×4)=64维的SURF特征描述子。
3.2)构建聚类加权的SURF特征向量
3.2a)选择网格对青铜器铭文图像的SURF特征进行特征点定位,将其作为视觉单词,然后根据K-means算法进行聚类,得到K个类心,每个类心代表对应特征的视觉词汇,一幅青铜器铭文图像就可以得到K×64维的视觉词典:
Ddic=[D1,D2,…,Dk] (14)
3.2b)由于同一青铜器铭文类别中出现频率较高的特征词汇,在其他类别中出现频率较低,根据局部SURF特征在不同青铜器铭文类别中的重要性不同,本实施例利用词频-逆文件频率加权的策略,词频(Term Frequency,TF)为局部特征词权重公式定义为
式中,z(λ,j)是特征词λ在青铜器铭文图像特征文件j中出现的次数,∑iz(λi,j)是特征词λ在该文件的总数。逆文件频率(Inverse Document Frequency,IDF)为全局特征词权重,公式表示为
式中,J为所有青铜器铭文特征文件总数,jλ是文件库中包含特征词汇λ的特征文件的总数。当很多特征文件都包含某个词汇时,idf值较小,反之,只在较少文件中出现的特征词汇idf值相对较大,它能有效地表明不同特征词的重要程度。
综合考虑特征词汇在单个特征文件中出现的频率和该词在所有文件集中的逆文件频率得到TF-IDF的计算公式为
T=tf×idf (17)
在一幅青铜器铭文图像中某一个特征词汇出现频率较高,在其他图像中出现次数很低,得到TF-IDF较高,表明该特征词汇具有较高的类别区分能力。将上式(17)得到的权重值乘以对应视觉特征词向量作为青铜器铭文图像的局部特征描述,聚类加权的SURF视觉特征表示为
FTF-KSURF=[B1,B2,…Bk] (18)
步骤4,构造多测度的相似性度量,具体步骤为:
4.1)利用步骤2中的Hu矩特征生成全局相似性测度:
式中,q为查询青铜器铭文图像,l为数据集中的一幅青铜器铭文图像,Qi为7阶Hu矩对应的权重,选取对应权重为:
Qi=[0.3,0.25,0.2,0.1,0.05,0.05,0.05] (20)
4.2)利用步骤3中的聚类加权的SURF(TF-KSURF)特征生成局部相似性测度:
根据两种特征测度对青铜器铭文检索结果的影响将两种测度进行加权融合,得到相似性度量公式:
SHu-TFS=ρSimHu+γSimTF-KSURF (22)
式中,ρ和γ分别是两种测度对应的权重系数,ρ+γ=1。
经上述步骤后,为了测试算法性能,申请人将本实施例给出的基于多特征测度的青铜器铭文相似性度量方法分别与只使用Hu矩测度和SURF测度进行青铜器铭文检索进行对比实验。
实验数据集选用428幅青铜器铭文图像,包括屯、中、祀、方和王等21类铭文,每类青铜器铭文的异写体有6至62张图片,实验选用10中类别青铜器铭文,每类随机选取6张青铜器铭文图像,并从查准率、平均查全率两个方面对算法进行客观评价。本发明提出的多测度相似性度量方法作为铭文的相似性度量在检索识别中能有效识别最相似青铜器铭文并且对相似青铜器铭文进行排序。
表1中给出了三种算法的查准率和查全率实验结果,图1为三种算法的查准率曲线图,图2为三种算法的查全率曲线图。
表一:三种算法查准率和查全率对比
从表1可以看出,本发明的基于多特征测度的青铜器铭文相似性度量方法的平均准确度均高于两种单一测度,在类别2、类别5和类别8中平均准确度达到100%。提出的多特征测度平均查全率最高为0.71,相较于SURF特征测度和Hu矩特征测度平均查全率分别提高了32.4%和22.5%。对比两种单一特征测度,融合Hu矩和聚类加权的SURF多特征测度的青铜器铭文检索识别具有更高的查全率。
图2和图3为三种算法的查准率和平均查全率性能曲线,从图中可以看出,结合青铜器铭文图像的全局Hu矩形状特征与局部SURF几何特征既能准确描述青铜器铭文图像的形状结构信息,又能表征青铜器铭文图像的显著局部几何信息,同时对局部SURF特征进行加权聚类,进一步提高了检索的准确率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,本发明不限于上述实施例。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (5)
1.一种基于多特征测度的青铜器铭文相似性度量方法,其特征在于,包括以下步骤:
步骤一,利用非局部均值滤波算法,对采集的青铜器铭文图像数据去噪处理,建立青铜器铭文图像数据集;
步骤二,使用Hu不变矩算法提取青铜器铭文的7阶Hu矩,构造青铜器铭文的全局形状特征向量;
步骤三,利用加速鲁棒特征算法提取青铜器铭文的局部加速鲁棒特征向量,并利用K均值聚类算法对加速鲁棒特征进行聚类,利用加权策略,进一步剔除冗余信息;
步骤四,将步骤二中的铭文全局Hu矩特征向量与步骤三中的聚类加权的加速鲁棒特征进行融合,形成多相似性度量对青铜器铭文进行检索;具体过程为:
1)Hu矩相似性测度:对于两幅进行青铜器铭文图像,设I为查询青铜器铭文图像,l为数据集中的一幅青铜器铭文图像,基于全局Hu矩形状特征的全局相似性测度计算公式为:
式中,Qi为7阶Hu矩对应的权重,根据不同阶数的重要性分配不同的权重,低阶矩更描述青铜器铭文图像的整体形状轮廓,高阶矩描述青铜器铭文图像的结构细节,选取对应权重为:
Qi=[0.3,0.25,0.2,0.1,0.05,0.05,0.05]
2)聚类加权的加速鲁棒特征相似性测度:
基于局部聚类加权的加速鲁棒特征的局部相似性测度的计算公式为:
根据两种特征测度对青铜器铭文图像检索结果的影响,将两种测度进行加权融合,得到多相似性度量公式:
SHu-TFS=ηSimHu+ξSimTF-KSURF
式中,η和ξ分别是两种测度对应的权重系数,η+ξ=1。
2.如权利要求1所述的方法,其特征在于,步骤一中所述利用非局部均值滤波算法,对采集的青铜器铭文图像去噪处理的其具体过程为:
假设青铜器铭文图像ν{ν(α)|α∈Ι},Ι为图像的坐标域,对于其中一个像素α,使用非局部平均的方法计算图像中其余所有像素的加权平均值,来得到该像素点的估计值,即
其中,权值由α与β之间的相似性计算得到,并需满足条件:像素α与β的相似性由其相对应的灰度值向量Να与Νβ的相似性得到;Να,Νβ表示以像素α和β为中心选取固定大小的邻域矩阵,各邻域灰度值向量之间的相似性根据高斯加权的欧式距离衡量如公式(2)所示:
式中,α>0,是高斯核函数的标准差;
权重的选取是根据不同像素间的相似性,将邻域像素加权得一个近似值,相似度越高的邻域矩阵向量,加权平均时对应像素点权值越大,权重的计算公式为:
其中,Z(α)为归一化系数,h为平滑参数,控制高斯函数的衰减程度;
经过非局部均值滤波之后的图像,噪声点得到有效去除的同时青铜器铭文的几何结构信息得到增强。
3.如权利要求1所述的方法,其特征在于,步骤二中所述的提取Hu矩特征作为青铜器铭文全局形状特征向量的具体过程为:
设一幅青铜器铭文图像f(x,y),其(p+q)阶矩定义为:
中心距定义为:
其中,p,q=0,1,2,3…,矩心为图像边缘的质心位置,中心距μpq具有位移不变性;矩心计算如下式所示:
其中,m00为图像的0阶几何矩,m10和m01为图像的两个1阶几何矩,由此可以构造出归一化的中心矩,则归一化中心矩定义为:
其中,p+q=2,3…;
利用二阶和三阶归一化中心距能够得到7个Hu不变矩,即:
φ1=η20+η02
φ3=(η30-3η12)2+(3η21-η03)2
φ4=(η30+η12)2+(η21+η03)2
为了使不变矩的值对结果识别的贡献增大并缩小数据偏差,对上式中的值用取对数的方式进行修正如下:
Φi=|lg(|φi|)|i=1,2,…7 (10)
最后,得到青铜器铭文的Hu矩特征向量为:
FHu=[Φ1,Φ2,Φ3,Φ4,Φ5,Φ6,Φ7] (11)。
4.如要求1所述的方法,其特征在于,步骤三中所述提取利用加速鲁棒特征算法提取青铜器铭文局部加速鲁棒特征的具体过程为:
1)铭文特征点检测
二阶导数矩阵是加速鲁棒特征算法的核心,加速鲁棒特征算法采用二阶导数矩阵的行列式近似确定特征点的尺度和位置;
假设青铜器铭文图像I中给定点Ρ=(x,y),定义在尺度σ上的图像二阶导数矩阵为:
式中,Sxx(Ρ,σ),Sxy(Ρ,σ),Syx(Ρ,σ),Syy(Ρ,σ),是图像在点Ρ处的高斯二阶微分的卷积;
为了提高运算速度与鲁棒性,采用盒式滤波近似值代替二次高斯卷积值,同时为减少近似值与准确值的误差,引入了一个加权参数,权值为0.9,因此二阶导数矩阵的判别式为:
Δ(Ηes)=Sxx·Syy-(0.9·Sxy)2 (13)
采用3×3×3线性插值法,计算偏移量去除有偏差的点获取特征点的精确定位;
2)确定主方向
为了保证图像特征的旋转不变性,以特征点为中心,半径为6s的圆形邻域内计算图像在x和y方向的哈尔小波响应,其中s为特征点所在的尺度,根据对应位置赋权值,越近权值较大;然后通过将60度的扇形邻域内的所有哈尔小波响应叠加,得到一个新的矢量,遍历整个圆形邻域,得到一个最长的矢量,以该矢量的方向作为特征点的主方向;
3)生成加速鲁棒特征点描述子
确定特征点的主方向后,在关键点周围选取一个边长为20s的正方形窗口同时该方形区域与关键点的主方向平行;然后将该方形区域划分成4×4的子区域,以模板为2×2的哈尔小波计算每个子区域中像素点在水平和垂直方向上的4个小波特征,分别为水平方向和∑wx,水平方向绝对值之和∑|wx|,垂直方向∑wy,垂直方向绝对值之和∑|wy|;这样每个4×4的子区域都有一个4维描述子,最终得到4×(4×4)=64维的加速鲁棒特征描述子。
5.如利要求1所述的方法,其特征在于,步骤三中所述提取青铜器铭文局部加速鲁棒特征向量进行聚类加权的具体过程为:
1)选择网格对青铜器铭文图像的加速鲁棒特征进行特征点定位,将其作为视觉单词,然后根据K均值聚类算法算法进行聚类,得到K个类心,每个类心代表对应特征的视觉词汇,一幅铭文图像就可以得到K×64维的视觉词典:
Ddic=[D1,D2,…,Dk] (14)
2)由于同一青铜器铭文类别中出现频率较高的特征词汇,在其他类别中出现频率较低,根据局部加速鲁棒特征在不同铭文类别中的重要性不同,利用词频-逆文件频率加权的策略,将视觉词典Ddic中每个特征词汇赋以权值,用聚类加权的视觉特征表示青铜器铭文图像,词频为局部特征词权重公式定义为:
式中,z(λ,j)是特征词λ在青铜器铭文图像特征文件j中出现的次数,∑iz(λi,j)是特征词λ在该文件的总数;逆文件频率为全局特征词权重,公式表示为:
式中,J为所有青铜器铭文特征文件总数,jλ是文件库中包含特征词汇λ的特征文件的总数;当很多特征文件都包含某个词汇时,idf值较小,反之,只在较少文件中出现的特征词汇idf值相对较大,它能有效地表明不同特征词的重要程度;
综合考虑特征词汇在单个特征文件中出现的频率和该词在所有文件集中的逆文件频率得到词频-逆文件频率的计算公式为:
T=tf×idf (17)
在一幅青铜器铭文图像中某一个特征词汇出现频率较高,在其他图像中出现次数很低,得到词频-逆文件频率较高,表明该特征词汇具有较高的类别区分能力;
将上式(17)得到的权重值乘以对应视觉特征词向量作为铭文的局部特征描述,其表示为
FTF-KSURF=[B1,B2,…Bk] (18)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010933921.9A CN112183585B (zh) | 2020-09-08 | 2020-09-08 | 一种基于多特征测度的青铜器铭文相似性度量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010933921.9A CN112183585B (zh) | 2020-09-08 | 2020-09-08 | 一种基于多特征测度的青铜器铭文相似性度量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112183585A CN112183585A (zh) | 2021-01-05 |
CN112183585B true CN112183585B (zh) | 2024-08-02 |
Family
ID=73924928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010933921.9A Active CN112183585B (zh) | 2020-09-08 | 2020-09-08 | 一种基于多特征测度的青铜器铭文相似性度量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183585B (zh) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2530687B1 (es) * | 2013-09-04 | 2016-08-19 | Shot & Shop. S.L. | Método implementado por ordenador para recuperación de imágenes por contenido y programa de ordenador del mismo |
CN103729631B (zh) * | 2014-01-15 | 2017-01-18 | 中国人民解放军国防科学技术大学 | 一种基于视觉的连接器表面特征自动识别方法 |
CN104504749B (zh) * | 2014-12-06 | 2017-07-07 | 陕西历史博物馆 | 一种基于三维重构技术的青铜器铭文信息提取与记录方法 |
CN104463247B (zh) * | 2014-12-09 | 2016-08-31 | 山东大学 | 一种高光谱图像分类中光谱向量互相关特征的抽取方法 |
CN105139013B (zh) * | 2015-07-08 | 2019-02-26 | 河南科技大学 | 一种融合形状特征和兴趣点的物体识别方法 |
CN104965928B (zh) * | 2015-07-24 | 2019-01-22 | 北京航空航天大学 | 一种基于形状匹配的汉字图像检索方法 |
CN107563438B (zh) * | 2017-08-31 | 2019-08-30 | 西南交通大学 | 一种快速鲁棒的多模态遥感影像匹配方法和系统 |
CN109993097A (zh) * | 2019-03-25 | 2019-07-09 | 中国石油化工股份有限公司 | 基于结构光的电力金具表面铭文识别方法 |
CN111091133B (zh) * | 2019-11-05 | 2023-05-30 | 西安建筑科技大学 | 一种基于sift算法的青铜器金文图像识别方法 |
CN111382749B (zh) * | 2020-03-02 | 2023-04-18 | 西安建筑科技大学 | 一种基于二维结构特征的青铜器铭文图像自动识别方法 |
-
2020
- 2020-09-08 CN CN202010933921.9A patent/CN112183585B/zh active Active
Non-Patent Citations (1)
Title |
---|
基于Hu矩和TF-KSURF的多测度青铜器铭文相似性度量方法;尚立丽等;激光与光电子学进展;20210430;第58卷(第8期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112183585A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107368807B (zh) | 一种基于视觉词袋模型的监控视频车型分类方法 | |
CN102663391B (zh) | 一种图像的多特征提取与融合方法及系统 | |
CN113360701B (zh) | 一种基于知识蒸馏的素描图处理方法及其系统 | |
CN105138672B (zh) | 一种多特征融合的图像检索方法 | |
CN110675437A (zh) | 一种基于改进gms-orb特征的图像匹配方法及存储介质 | |
CN101140624A (zh) | 图像匹配方法 | |
CN103077389A (zh) | 一种结合字符级分类和字符串级分类的文本检测和识别方法 | |
CN108388902B (zh) | 结合全局框架点与局部shot特征的复合3d描述子构建方法 | |
CN110766708B (zh) | 基于轮廓相似度的图像比较方法 | |
CN105740378B (zh) | 一种数字病理全切片图像检索方法 | |
CN108509925B (zh) | 一种基于视觉词袋模型的行人重识别方法 | |
CN111652273B (zh) | 一种基于深度学习的rgb-d图像分类方法 | |
CN106096517A (zh) | 一种基于低秩矩阵与特征脸的人脸识别方法 | |
CN105654122B (zh) | 基于核函数匹配的空间金字塔物体识别方法 | |
JP4937395B2 (ja) | 特徴ベクトル生成装置、特徴ベクトル生成方法及びプログラム | |
CN112182264B (zh) | 地标信息的确定方法、装置、设备及可读存储介质 | |
CN104361339B (zh) | 掌形图形提取及识别方法 | |
CN117236014A (zh) | 基于深度非负矩阵分解的多视图聚类方法、设备和介质 | |
CN112949422B (zh) | 一种基于自监督光谱匹配框架的高光谱目标检测方法 | |
CN104965928B (zh) | 一种基于形状匹配的汉字图像检索方法 | |
CN113762151A (zh) | 一种故障数据处理方法、系统及故障预测方法 | |
JP3903613B2 (ja) | 検索装置及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
CN112966629A (zh) | 基于图像变换和BoF模型的遥感图像场景分类方法 | |
CN112183585B (zh) | 一种基于多特征测度的青铜器铭文相似性度量方法 | |
CN105844299B (zh) | 一种基于词袋模型的图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |