CN106204530A - 基于图像配准的古代西夏文活字印刷术鉴别方法 - Google Patents

基于图像配准的古代西夏文活字印刷术鉴别方法 Download PDF

Info

Publication number
CN106204530A
CN106204530A CN201610481607.5A CN201610481607A CN106204530A CN 106204530 A CN106204530 A CN 106204530A CN 201610481607 A CN201610481607 A CN 201610481607A CN 106204530 A CN106204530 A CN 106204530A
Authority
CN
China
Prior art keywords
registration
character
point set
model
typography
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610481607.5A
Other languages
English (en)
Other versions
CN106204530B (zh
Inventor
杜少毅
毕泊
许光林
孙飞鹏
薛建儒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201610481607.5A priority Critical patent/CN106204530B/zh
Publication of CN106204530A publication Critical patent/CN106204530A/zh
Application granted granted Critical
Publication of CN106204530B publication Critical patent/CN106204530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于图像配准的古代西夏文活字印刷术鉴别方法,其中图像配准算法主要采用基于动态树的非刚体配准,通过提取字符图像的边缘特征点,根据仿射迭代最近点(ICP)算法的配准结果来度量字符图像的形状相似性,将相似的图像预连接起来,并在此基础上动态地利用一致点漂移(CPD)方法进行图像的非刚体配准;通过比较图像配准算法的结果来衡量字符图像之间的误差,选择出具有相对准确配准结果的字符图像,从而判断这些字符图像是否是由相同类型的活字模板印刷而成,最后,再结合这些字符图像的其他特征来进一步论证此判断。本发明采用基于配准识别的方法更加科学,与人为地比较几何特征的方法相比也更方便和快捷。

Description

基于图像配准的古代西夏文活字印刷术鉴别方法
技术领域
本发明涉及西夏学、考古学和图像配准领域,具体涉及一种利用仿射ICP算法的结果描述西夏文字符活字模板的相似性、在此基础上建立树并根据CPD非刚体配准动态地调整树结构同时得到精确的匹配结果,以此来科学鉴别活字印刷模板的方法。
背景技术
西夏文是11-13世纪中国西北地区西夏王朝区域内用来书写西夏语言的文字。西夏政权灭亡后,西夏文字仍旧使用了数百年。留存至今的西夏文文献有数十万页,内容涵盖辞书、文学、医药、法律、公文、佛教典籍等。这些文献包括写本以及印本;印本中有一些采用了活字印刷技术。活字印刷术的发明是我国古代劳动人民的智慧结晶,活字印刷术印刷一版能印几百部甚至几千部书,对文化的传播起了很大的作用,体现了古代中国劳动人民的智慧。活字印刷术的发明是印刷史上一次伟大的技术革命。提高了印刷效率,促进文化传播与发展,更重要的是传入欧洲之后对于欧洲启蒙的发展功不可没,为书籍的传抄提供了更加便利的,为书籍及时有效的传播提供了便利的条件。活字印刷术虽普遍被认为是中国古代四大发明之一,然而对活字印刷术的发明及传播路线也存在着一些争议。活字印本的科学鉴别无疑会对解决这一争议问题提供有利证据。
活字本的印书,无论是泥活字,铜活字或其它活字,尽管制作活字的原材料不同,方法各异,但在印刷书籍之前的技术规程,即检字、排字、拼版等程序大致无二。因此,凡属活字印本,都具有共同的特点;但由于原材料的差异,也有其不尽相同的地方。在现有的活字印刷术研究领域中,最常用的方法是通过分析西夏文字符图像的几何特征值,如高度、宽度、面积、重心和宽高比等,通过比较这些特征值的差异来实现活字印刷模型的鉴别。
图像点集配准是可用于活字印本鉴别的一项关键技术,配准的目标是通过一种或一系列的几何变换,使两个图像点集的点在空间上对应起来。图像点集配准方法中,迭代最近点(Iterative Closest Point,ICP)算法、薄板样条-鲁棒对应点(Thin Plate Spline-Robust Point Matching,TPS-RPM)算法、一致点漂移(Coherent Point Drift,CPD)算法都是有效地解决图像点集配准的方法。这些配准方法能完成形状或结构相似的图像间的有效且精确的配准,然而,当图像变形较大时则无法获得令人满意的配准效果。
发明内容
本发明的目的在于提供一种新型的基于图像配准的古代西夏文活字印刷术鉴别方法。
为达到上述目的,本发明采用了以下技术方案。
1)图像相似性度量
用canny算子提取每个字符特征图像的边缘点后,模型点集M和目标点集S之间进行仿射ICP配准,用配准结果来测量双向距离,衡量形状相似性,将距离不超过给定仿射配准阈值的两个字符图像连接起来,以此来建立一个预连接关系;
2)基于动态树的非刚体配准
在建立动态树的过程中实时根据CPD非刚体配准的结果对树进行动态的调整,之后再根据树进行CPD非刚体配准。精确的树状结构帮助形变较大的字符图像找到形变较小的中间字符图像进行配准来提高精度,动态性可以实时剔除错误图像配对,保障配准结果的精确;
3)活字印刷术鉴别
根据非刚体配准的误差来鉴别活字印刷模型。如两个字符有相近的形状特征,那么它们的图像配准更接近,也更能说明这两个字符是由同一个模板印刷的,反之亦然。
所述步骤1)的具体步骤为:用canny算子提取每个字符特征图像的边缘点;通过仿射ICP配准算法的迭代求解,可以快速地求得模型点集M和目标点集S之间的相似性度量d(M,S),将距离不超过给定仿射配准阈值的两个字符图像预连接起来,以供进一步精确配准。
所述仿射ICP配准算法每一步迭代过程包含以下两个步骤:
第一步,根据第k-1步中的仿射变换建立两个点集之间的双向的对应关系
c k ( i ) = argmin j ∈ { 1 , 2 , ... , N m } | | ( A k - 1 p → i + t → k - 1 ) - m → j | | 2 2 , i = 1 , 2 , ... , N s
d k ( j ) = argmin i ∈ { 1 , 2 , ... , N s } | | ( A k - 1 p → i + t → k - 1 ) - m → j | | 2 2 , j = 1 , 2 , ... , N m
第二步,根据上一步得到的两个点集之间的双向对应关系计算两点集之间新的仿射变换
( A k , t → k ) = argmin A T A = I n , det ( A ) = 1 ( Σ i = 1 N s | | ( A p → i + t → ) - m → c k ( i ) | | 2 2 + Σ j = 1 N m | | ( A p → d k ( j ) + t → ) - m → j | | 2 2 )
重复此迭代过程,直到满足下列两个条件之一:1)当前步计算得到的均方误差小于设定误差的值;2)迭代达到设定的最大迭代次数
所述相似性度量d(M,S)根据基于双向距离的最小平方(Least Square,LS)误差的仿射ICP配准结果获得,计算公式为:
d ( M , S ) = 1 / N M ( Σ i = 1 N M | | Am i + t - s c k ( i ) | | 2 + 1 / N S Σ j = 1 N S | | Am d k ( j ) + t - s j | | 2 )
其中,含有NS个点的形状点集S经过仿射变换A和t后与含有NM个点的模型点集M对齐,得到点对
所述步骤1)中,所述预连接关系中,以待配准的模型点集作为根节点,根据其与目标点集仿射ICP配准结果是否小于仿射配准阈值,决定是否与该目标点集连接。
所述步骤2)中,基于动态树的非刚体配准先根据预连接关系,将模型点集与连接的目标点集进行CPD非刚体配准,若配准误差大于非刚体配准阈值,则断开连接;若配准双向误差小于非刚体性配准阈值,则确定连接关系,将确定连接关系的点集从目标数据集中移除,并将此点集加入模型数据集。断开连接的点集返回目标数据集,继续与扩充的模型数据集配准,直到目标数据集为空停止。
所述CPD非刚体算法具体步骤为:
假设字符图像的模型点集M和目标点集S能完成非刚体配准,则它的最大似然估计函数表示为:
Q ( θ , σ 2 ) = 1 / 2 σ 2 Σ i = 1 N M Σ j = 1 N S P o l d ( i | s j ) | | s j - T ( m i , θ ) | | 2 + N P D / 2 × logσ 2
其中Pold表示后验概率,θ表示变换T的参数集合,σ2表示GMM的方差。
根据上面的最大似然估计函数,CPD算法通过计算方差的变化可以计算出点集间的最优变换。该过程可以通过E-step和M-step的反复迭代来完成。E-step能计算出点集间对应关系的概率,而M-step可计算出点集间的变换。重复该过程,直至算法收敛,得到最优的配准变换。
所述非刚体配准误差,即完成基于动态树的非刚体匹配的两个字符图像之间的双向欧氏距离,被定义为:
e = ( Σ i = 1 N M | | q → i - s → r ( i ) | | 2 2 + Σ j = 1 N S | | q → t ( j ) - s → j | | 2 2 ) / ( N M + N S )
其中e是双向欧氏距离,是经过非刚体变换后的模型点集,是变换后的点集之间最近的对应关系。
所述步骤3)中,用基于动态图的非刚体算法完成有效的模型字符与目标字符的配准,从而获得模型字符与目标字符的差异,用所述配准误差进行字符鉴别,通过选择出具有相对准确配准结果的字符图像,从而判断这些字符图像可能是由相同类型的活字模板印刷而成,否则,则是由不同类型活字模板印刷而成。
本发明提供一种基于图像配准的古代西夏文活字印刷术鉴别方法,其中图像配准算法主要采用基于动态树的非刚体配准,通过提取字符图像的边缘特征点,根据仿射迭代ICP算法的配准结果来度量字符图像的形状相似性,将相似的图像预连接起来,并在此基础上利用CPD方法进行图像的非刚体配准,同时建立树结构解决形变较大图像的配准问题,而且实时根据非刚体配准双向误差动态调整树结构来防止错误;通过比较图像配准算法的结果来衡量字符图像之间的误差,选择出具有相对准确配准结果的字符图像,从而判断这些字符图像是否是由相同类型的活字模板印刷而成,最后,再结合这些字符图像的其他特征来进一步论证此判断。本发明采用基于配准识别的方法更加科学,与人为地比较几何特征的方法相比也更方便和快捷。
本发明有以下几个特点:
1)采用仿射迭代最近点算法对字符模型点集和目标点集进行配准,根据配准双向误差的结果衡量字符形状相似性。仿射迭代最近点算法中仿射矩阵A与平移向量由两点集全局地生成,因而算法速度较快,适合进行初步配准估算。但也正是因为算法的全局性导致当点集之间形状差距较大时,算法的可靠性下降,因此仿射迭代最近点配准十分适合对点集进行初步配准,以供之后的算法进行再处理。
2)采用树结构解决形变较大的图像之间的配准问题。以启发树的拓扑结构形象化图像相似性的远近关系;在启发树中,具有相似结构的字符图像连接在一起,而形变较大的图像则通过若干层间接连接;通过这种方式,较大差异的变换被分解为若干较小差异的变换,使得变形较大的图像之间配准得到解决。
3)动态地调整树的结构,保留正确的连接,实时剔除错误的连接,进一步保障配准的精确。在建树过程中直接进行CPD非刚体配准,双向距离度量的形式评估CPD配准误差来实时调整树的结构,将CPD非刚体配准结果错误的点集之间的连接断开。通过在动态建树过程中及时地断开非线性配准错误的点集之间的连接关系,既能使错误配准的点集得到正确配准的机会,又避免了错误配准结果的进一步扩大,有效地提升了配准的准确性;
4)基于配准误差来鉴别字符模板不受主观影响,抗干扰能力强。算法每次能实现一个数据集的配准,无须人为的一个个比较,速度快且更容易分析处理;因此该系统具有客观,科学,新颖,高效的特点。
附图说明
图1是本发明的流程示意图;
图2是仿射ICP配准算法流程图;
图3是基于动态树的非刚体配准的流程图;
图4是本发明实际应用的数据对比图,其中,(a)为西夏文《华严经》80卷中45个“佛”字的字符图像;(b)为(a)中27号“佛”字为根节点的树图。
具体实施方式
下面结合附图对本发明作进一步说明。
参见图1,基于图像配准的古代西夏文活字印刷术鉴别方法分为三部分,包括的各个步骤如下:
1)基于形状相似性的树的构建,具体步骤如下:
(1a)建立西夏文字符数据集,用canny算子提取每个字符特征图像的边缘点;
(1b)遍历数据集,模型点集和目标点集进行仿射ICP配准;
(1c)利用配准误差结果来测量双向距离,计算相似性度量d(M,S);
(1d)设定仿射误差阈值,以此来建立一个预连接关系;
根据图2,仿射ICP配准算法算法的具体实现过程如下:
第一步,根据第k-1步中的仿射变换建立两个点集之间的双向的对应关系
c k ( i ) = argmin j ∈ { 1 , 2 , ... , N m } | | ( A k - 1 p → i + t → k - 1 ) - m → j | | 2 2 , i = 1 , 2 , ... , N s
d k ( j ) = argmin i ∈ { 1 , 2 , ... , N s } | | ( A k - 1 p → i + t → k - 1 ) - m → j | | 2 2 , j = 1 , 2 , ... , N m
第二步,根据上一步得到的两个点集之间的双向对应关系计算两点集之间新的仿射变换
( A k , t → k ) = argmin A T A = I n , det ( A ) = 1 ( Σ i = 1 N s | | ( A p → i + t → ) - m → c k ( i ) | | 2 2 + Σ j = 1 N m | | ( A p → d k ( j ) + t → ) - m → j | | 2 2 )
重复此迭代过程,直到满足下列两个条件之一:1)当前步计算得到的均方误差小于设定误差的值;2)迭代达到设定的最大迭代次数。
相似性度量d(M,S)根据基于双向距离的LS误差的仿射ICP配准结果获得,计算公式为:
d ( M , S ) = 1 / N M ( Σ i = 1 N M | | Am i + t - s c k ( i ) | | 2 + 1 / N S Σ j = 1 N S | | Am d k ( j ) + t - s j | | 2 )
其中,含有NS个点的形状点集S经过仿射变换A和t后与含有NM个点的模型点集M对齐,得到点对
2)基于动态树的非刚体配准,根据图3,具体步骤如下:
(2a)初始化目标数据集为所有目标点集,模型数据集作为待配准点集,即每次配准的根节点。遍历所有目标数据集,将与模型点集预连接的目标点集进行CPD非刚体配准;
(2b)计算非刚体配准双向误差,判断目标点集与模型点集配准变换是否正确。若目标点集与该模型点集CPD配准双向误差大于非刚体配准阈值,则断开预连接;若配准双向误差小于非刚体配准阈值,则确定连接关系,并将变换后的目标点集从目标数据集移至模型数据集,以供与下层节点配准使用;
(2c)遍历剩下的目标数据集,继续寻找与其他模型点集相似的目标点集并进行CPD非刚体配准,构成新的一层。对于新层中某一点集,若配准得到的双向误差小于非刚体配准阈值,说明配准结果是正确的,继续保留与上层点集的连接关系,将目标点集从目标数据集中移出,并将其加入至模型数据集,以供与下层节点配准使用。若配准得到的双向误差大于非线性配准阈值,表明配准结果是错误的,断开与上层点集的连接关系。经过此步确定了树的新的一层保存配准变形后的点集保存至模型数据集,将确定连接关系的点集从目标数据集中移除。
(2d)直到目标数据集为空停止。
CPD非刚体配准算法具体步骤为:
假设字符图像的模型点集M和目标点集S能完成非刚体配准,则它的最大似然估计函数表示为:
Q ( θ , σ 2 ) = 1 / 2 σ 2 Σ i = 1 N M Σ j = 1 N S P o l d ( i | s j ) | | s j - T ( m i , θ ) | | 2 + N P D / 2 × logσ 2
其中Pold表示后验概率,θ表示变换T的参数集合,σ2表示GMM的方差。
根据上面的最大似然估计函数,CPD算法通过计算方差的变化可以计算出点集间的最优变换。该过程可以通过E-step和M-step的反复迭代来完成。E-step能计算出点集间对应关系的概率,而M-step可计算出点集间的变换。重复该过程,直至算法收敛,得到最优的配准变换。
3)根据非刚体配准的误差来鉴别活字印刷模型,具体步骤如下:
(3a)计算字符图像的模型点集和目标点集之间的非刚体配准误差;
完成基于动态树的非刚体匹配的两个字符图像之间的双向欧氏距离,即非刚体配准误差,被定义为:
e = ( Σ i = 1 N M | | q → i - s → r ( i ) | | 2 2 + Σ j = 1 N S | | q → t ( j ) - s → j | | 2 2 ) / ( N M + N S )
其中e是双向欧氏距离,是经过非刚体变换后的模型点集,是变换后的点集之间最近的对应关系。
(3b)活字印刷模型鉴别
通过比较字符图像的模型点集和目标点集之间的配准误差,可以快速选择出具有相对准确配准结果的西夏文字符图像,再进一步结合笔画粗细、形状、周长等字符特征信息,从而判断这些字符图像可能是由相同类型的活字模板印刷而成,实现更为精确地字符鉴别。
本发明中基于动态树的非刚体图像配准算法,主要基于树的层级分散结构,通过中间节点将根节点和子节点连接起来,大的变形被模拟成几个小的变形,提高了图像配准的成功率;并且在建树过程中就已经动态地淘汰了非刚体配准结果错误的点集,防止了错误的产生即扩大,保障了精确性;同时,利用最终非刚体图像配准算法的误差结果进行活字印刷模板的鉴别,能够确保西夏文活字模板鉴别结果的准确性,有效消除肉眼的主观影响,并在字符特征存在着较大差异性的情况下保持配准的精度。试验结果表明,本发明提出的算法能够很好的利用图像配准技术,在古文字符数量巨大、差异良莠不齐的客观条件下为古文活字鉴别提供自动可靠的参考信息。此外,本发明还具有新颖、方便、可靠的特点。
根据图4,可以看出本发明在实际应用中的效果。图4(a)是实验所用的测试数据,来自西夏文《华严经》80卷中45个“佛”字的字符图像。从图4(b)可以看出,在启发式树中,3号佛字作为根节点,与117号字符直接连接它们之间的误差相对较小,配准精度较高。由于第三层的字符图像与3号佛字的图像差异较大,若直接采用CPD配准,其配准结果较差,而通过启发树能更好地完成差异性较大的点集间的配准。可以看出,与CPD相比,通过启发树的配准方法,对于未与根节点直接相连的图像,其配准误差明显减小。因此,本文的方法可实现图像间更为精确的非刚体配准。
在通过本文的方法对西夏字符准确配准之后,本文选择出具有较小配准误差的字符进行同一模板的鉴别。例如,在所有“佛”字图像中,如果以3号字符图像为字符模板,那么字符68号和117号相比于其他字符具有更精确的配准结果。这意味着这三个字符非常相似。这说明了字符68号、117号和3号来自相同的活字印刷模板。
值得强调的是,在启发树结构中,以3号字符图像作为根节点,而18号字符图像则位于第三层,这意味着18号与3号有一定差异性,所以这两个字符图像之间直接通过CPD配准,误差较大。然而,通过启动树结构进行配准后,这两个字符实现较好的匹配。
为了证明本文方法在西夏文活字印刷术鉴别中的有效性,本文的方法和传统的人工比较字符特征值的方法相比较,发现其结果是一致的。然而,通过配准的鉴别方法更方便、更容易分析处理。当测量和比较字符特征值的方法应用于识别活字印刷模型时,干扰因素可能会影响字符的几何标准并且增加鉴别过程中的难度,如表1所示。由于噪声的干扰,这三个字符在某些重要的几何特征中存在着较大的差异性,如面积和周长。通过与表1的对比可以看出,本文所使用的算法新颖、方便、可靠,能确保西夏文活字模板鉴别结果的准确性。
No. 面积 宽/高 周长
19 48 52 1040 0.92 467.31
27 48 52 923 0.92 451.85
38 47 51 1086 0.92 430.10

Claims (8)

1.一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:包括以下步骤:
1)图像相似性度量
用canny算子提取每个字符特征图像的边缘点后,模型点集M和目标点集S之间进行仿射ICP配准,用配准结果来测量双向距离,衡量形状相似性,将距离不超过给定仿射配准阈值的两个字符图像连接起来,以此来建立一个预连接关系;
2)基于动态树的非刚体配准
在建立动态树的过程中实时根据CPD非刚体配准的结果对树进行动态的调整,之后再根据树,将形变较大的字符图像通过分解成一系列形变较小的中间字符图像进行CPD非刚体配准;
3)活字印刷术鉴别
根据非刚体配准的误差来鉴别活字印刷模型,如两个字符有在阈值范围内即认为他们相似,那么它们的图像配准更接近,表明这两个字符是由同一个模板印刷的,反之亦然。
2.根据权利要求1所述一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:所述步骤1)的具体步骤为:用canny算子提取每个字符特征图像的边缘点;通过仿射ICP配准算法的迭代求解,求得模型点集M和目标点集S之间的相似性度量d(M,S),将距离不超过给定仿射配准阈值的两个字符图像预连接起来,以供进一步精确配准。
3.根据权利要求2所述一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:所述仿射ICP配准算法,该算法的目标是寻找一个仿射变换A和t,使得目标点集S和模型点集M中的点能够在Euclidean距离空间中最好地对应起来,相似性度量d(M,S)用最小平方(Least Square,LS)距离进行度量。
4.根据权利要求2所述一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:所述相似性度量d(M,S)根据基于双向距离的LS误差的仿射ICP配准结果获得,计算公式为:
d ( M , S ) = 1 / N M ( Σ i = 1 N M | | Am i + t - s c k ( i ) | | 2 + 1 / N S Σ j = 1 N S | | Am d k ( j ) + t - s j | | 2 )
其中,含有NS个点的形状点集S经过仿射变换A和t后与含有NM个点的模型点集M对齐,得到点对
5.根据权利要求2所述一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:所述预连接关系中,以待配准的模型点集作为根节点,根据其与目标点集仿射ICP配准结果是否小于仿射配准阈值,决定是否与该目标点集连接。
6.根据权利要求1所述一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:所述步骤2)中,基于动态树的非刚体配准先根据预连接关系,将根节点对应的模型点集和与之相连的目标点集进行CPD非刚体配准,若配准误差大于非刚体配准阈值,则断开预连接;若配准双向误差小于非刚体配准阈值,则确定连接关系,并保存配准变形后的目标点集保存至模型数据集,将确定连接关系的点集从目标数据集中移除,直到目标数据集为空停止。
7.根据权利要求6所述一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:所述CPD非刚体算法具体步骤为:
假设字符图像的模型点集M和目标点集S能完成非刚体配准,则它的最大似然估计函数表示为:
Q ( θ , σ 2 ) = 1 / 2 σ 2 Σ i = 1 N M Σ j = 1 N S P o l d ( i | s j ) | | s j - T ( m i , θ ) | | 2 + N P D / 2 × logσ 2
其中Pold表示后验概率,θ表示变换T的参数集合,σ2表示GMM的方差,
根据上面的最大似然估计函数,CPD算法通过计算方差的变化可以计算出点集间的最优变换,该过程通过E-step和M-step的反复迭代来完成,E-step能计算出点集间对应关系的概率,而M-step可计算出点集间的变换,重复该过程,直至算法收敛,得到最优的配准变换。
8.根据权利要求1所述一种基于图像配准的古代西夏文活字印刷术鉴别方法,其特征在于:所述步骤3)中,用基于动态图的非刚体算法完成模型字符与目标字符的精确配准,从而获得模型字符与目标字符的差异,用所述配准误差进行字符鉴别,通过选择出具有相对准确配准结果的字符图像,从而判断这些字符图像可能是由相同类型的活字模板印刷而成,否则,则是由不同类型活字模板印刷而成。
CN201610481607.5A 2016-06-27 2016-06-27 基于图像配准的古代西夏文活字印刷术鉴别方法 Active CN106204530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610481607.5A CN106204530B (zh) 2016-06-27 2016-06-27 基于图像配准的古代西夏文活字印刷术鉴别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610481607.5A CN106204530B (zh) 2016-06-27 2016-06-27 基于图像配准的古代西夏文活字印刷术鉴别方法

Publications (2)

Publication Number Publication Date
CN106204530A true CN106204530A (zh) 2016-12-07
CN106204530B CN106204530B (zh) 2019-06-11

Family

ID=57461320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610481607.5A Active CN106204530B (zh) 2016-06-27 2016-06-27 基于图像配准的古代西夏文活字印刷术鉴别方法

Country Status (1)

Country Link
CN (1) CN106204530B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133978A (zh) * 2017-05-23 2017-09-05 哈尔滨工业大学 基于一致点漂移算法的三维非刚体点云配准方法
CN107204009A (zh) * 2017-05-23 2017-09-26 哈尔滨工业大学 基于仿射变换模型cpd算法的三维点云配准方法
CN108734085A (zh) * 2018-03-27 2018-11-02 中国银联股份有限公司 虹膜识别方法及虹膜识别系统
CN110705362A (zh) * 2019-09-06 2020-01-17 航天新长征大道科技有限公司 一种字印分析方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350101A (zh) * 2008-09-09 2009-01-21 北京航空航天大学 多幅深度图像自动配准方法
CN105631877A (zh) * 2015-12-28 2016-06-01 天津大学 基于加权双稀疏约束的非刚性表面配准方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350101A (zh) * 2008-09-09 2009-01-21 北京航空航天大学 多幅深度图像自动配准方法
CN105631877A (zh) * 2015-12-28 2016-06-01 天津大学 基于加权双稀疏约束的非刚性表面配准方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHAOYI DU 等: "Accurate non-rigid registration based on heuristic tree for registering point sets with large deformation", 《NEUROCOMPUTING》 *
白茹意 等: "基于ICP和CPD的颅骨自动配准算法", 《计算机技术与发展》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133978A (zh) * 2017-05-23 2017-09-05 哈尔滨工业大学 基于一致点漂移算法的三维非刚体点云配准方法
CN107204009A (zh) * 2017-05-23 2017-09-26 哈尔滨工业大学 基于仿射变换模型cpd算法的三维点云配准方法
CN107133978B (zh) * 2017-05-23 2019-05-17 哈尔滨工业大学 基于一致点漂移算法的三维非刚体点云配准方法
CN107204009B (zh) * 2017-05-23 2020-06-09 哈尔滨工业大学 基于仿射变换模型cpd算法的三维点云配准方法
CN108734085A (zh) * 2018-03-27 2018-11-02 中国银联股份有限公司 虹膜识别方法及虹膜识别系统
CN110705362A (zh) * 2019-09-06 2020-01-17 航天新长征大道科技有限公司 一种字印分析方法和装置

Also Published As

Publication number Publication date
CN106204530B (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
CN104463209B (zh) 一种基于bp神经网络的pcb板上数字代码识别方法
CN105488536B (zh) 一种基于多特征深度学习技术的农田害虫图像识别方法
CN104021394B (zh) 基于AdaBoost算法的绝缘子图像识别方法
CN107169485B (zh) 一种数学公式识别方法和装置
CN106204530A (zh) 基于图像配准的古代西夏文活字印刷术鉴别方法
CN105608454B (zh) 基于文字结构部件检测神经网络的文字检测方法及系统
CN106384094A (zh) 一种基于书写风格建模的中文字库自动生成方法
CN104463101A (zh) 用于文字性试题的答案识别方法及系统
CN104268134B (zh) 一种主客观分类器构建方法和系统
CN104008375B (zh) 基于特征融合的集成人脸识别方法
CN105809198A (zh) 基于深度置信网络的sar图像目标识别方法
CN105469047A (zh) 基于无监督学习深度学习网络的中文检测方法及系统
CN110689000B (zh) 一种基于生成复杂环境下车牌样本的车辆车牌识别方法
CN103366160A (zh) 融合肤色、人脸和敏感部位检测的不良图像判别方法
CN107133955A (zh) 一种多层次结合的协同显著性检测方法
CN108537219A (zh) 一种用于财务报表外框的智能检测方法及装置
CN107909053B (zh) 一种基于等级学习级联卷积神经网络的人脸检测方法
CN105069774A (zh) 基于多示例学习与图割优化的目标分割方法
CN108021869A (zh) 一种结合高斯核函数的卷积神经网络跟踪方法
CN109800746A (zh) 一种基于cnn的手写英文文档识别方法
CN111753873A (zh) 一种图像检测方法和装置
CN103455826B (zh) 基于快速鲁棒性特征的高效匹配核人体检测方法
CN103839075A (zh) 一种基于联合稀疏表示的sar图像分类方法
CN105488541A (zh) 增强现实系统中基于机器学习的自然特征点识别方法
CN106846363A (zh) 一种改进稀疏矩阵的尺度自适应性压缩跟踪方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant