CN112070684A - 基于形态先验特征的甲骨刻辞文字修复方法 - Google Patents
基于形态先验特征的甲骨刻辞文字修复方法 Download PDFInfo
- Publication number
- CN112070684A CN112070684A CN202010775134.6A CN202010775134A CN112070684A CN 112070684 A CN112070684 A CN 112070684A CN 202010775134 A CN202010775134 A CN 202010775134A CN 112070684 A CN112070684 A CN 112070684A
- Authority
- CN
- China
- Prior art keywords
- pixel
- value
- image
- equal
- carried out
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000000877 morphologic effect Effects 0.000 title claims abstract description 18
- 238000003708 edge detection Methods 0.000 claims abstract description 4
- 210000000988 bone and bone Anatomy 0.000 claims description 49
- 230000008439 repair process Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 241000270708 Testudinidae Species 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 7
- 210000003462 vein Anatomy 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000013519 translation Methods 0.000 abstract description 2
- 201000009182 Chikungunya Diseases 0.000 abstract 1
- 241001465754 Metazoa Species 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000005260 corrosion Methods 0.000 description 2
- 230000007797 corrosion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009232 chiropractic Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
本发明公开一种基于形态先验特征的甲骨刻辞文字修复方法,首先,去除甲骨刻辞图像的点状噪声,得到初步降噪后的图像;其次,通过分析甲骨文字区域和噪声区域的面积分布特征,将那些小于面积均值的连通区域和长宽比小的连通区域判定为噪声并进行填充,从而去除甲骨刻辞图像的片状斑纹和固有纹理;最后,进行基于Sobel算子的边缘检测、基于4‑链码的轮廓跟踪以及基于边缘向量夹角的边缘像素段分析和拐点提取,对甲骨文字的凹凸边缘进行基于像素段平移的平滑修复,进而在尽量保持文字字形的同时,实现甲骨文字的边缘修复。
Description
技术领域
本发明涉及数字图像处理和古文字信息处理的交叉领域,尤其是一种可有效抵抗龟甲和兽骨上的点状噪声、片状斑纹和固有纹理的干扰,准确性高、鲁棒性好、处理速度快及具备自适应能力的基于形态先验特征的甲骨刻辞文字修复方法。
背景技术
甲骨文是商朝后期用龟甲、兽骨进行记事和占卜的文字。它作为我国迄今为止发现的年代最早的成熟文字系统,具有极其重要的保护价值、研究价值以及崇高的象征意义。甲骨文不仅是我国语言、文化、历史可追溯的最早源头,是汉字的源头和中华优秀传统文化的根脉,是千年中华文明的标志,也印证了历史上一系列古文献的真实性,把有记载的中华文明史向前推进了近五个世纪。因此,甲骨文字考释成为古文字研究领域中最重要的内容之一,为研究中华源远流长的灿烂文明史和早期国家与人文社会形态,提供了独特而真实可信的第一手史料。
因为甲骨文字数量众多,年代久远,其结构不仅明显有别于现代文字,而且形体复杂、字形繁复、异体字众多,所以释读甲骨文要求研究者具有广博的知识基础和长期的专业训练,是一项极具挑战的任务。目前,仍存在大量甲骨文字未被准确释读,甚至有学者将其归之为“绝学”以内。随着计算机图像识别能力的提升,以计算机视觉技术为基础,结合甲骨文的专业知识,进行甲骨文字识别已成为可能。然而,一方面,经过三千余年的土壤压力和腐蚀,又经发掘、运输、辗转流传,很多甲骨均有不同程度的损坏,其文字多已模糊不清,另一方面,由于龟甲和兽骨的质地比较粗糙,本身又存在齿缝、兆纹、盾纹、刻痕等纹理,甲骨文字往往受到点状噪声、片状斑纹和固有纹理的强烈干扰,这就不可避免地导致甲骨拓片图像中的字迹经常出现断裂、毛刺、污迹以及与背景纹理的叠加,且文字边缘粗细不均,锯齿效应明显,有的地方向内凹陷,有的地方向外凸出。在这种情况下,欲想直接利用典型的文档分析和文字识别算法进行自动处理几乎是不可能的。因此,在龟甲或兽骨上自动定位到甲骨文字区域,并对其中的文字笔迹进行有效修复,对于提高后续的字形特征提取和自动识别的精度具有基础且重要的意义。
目前,典型的图像修复方法主要包括三类:基于偏微分方程的修复方法、基于稀疏表示的修复方法、基于纹理合成的修复方法。第一,基于偏微分方程的修复方法利用凸分裂的思想,将图像待修复区域周围的信息扩散至待修复区域。例如,Shen等人提出了一种整体变分算法;Chan等人提出了一种曲率驱动扩散算法等。该类方法适用于处理划痕等小尺度破损图像,但是对于大范围信息缺失的图像,其修复结果往往不尽人意。第二,基于稀疏表示的修复方法利用固定字典或者是字典学习的方法来修复图像的破损区域。由于自然图像本身具有稀疏性且稀疏表示能够有效刻画图像的内在结构和先验属性,从而实现图像的最优逼近,基于稀疏表示的策略在图像修复领域中获得了广泛应用。例如,Elad等人提出了稀疏形态成分分解模型;Sahoo等人提出了基于局部图像块的稀疏近似模型;李清泉等人结合人机交互和稀疏表示提出了壁画修复模型等。不过在通常情况下,图像的稀疏表示系数服从随机分布,若待修复区域的稀疏系数分布不同于其参考区域,则无法充分发掘稀疏系数的内在联系和相关样本图像块之间的相关性,以致影响图像的修复效果。第三,基于纹理合成的修复方法通过分析整幅图像的纹理特征,在已知区域内选择与待修复区域最相似的图像区块,来实现图像块的修复。例如,Hu等人利用唐卡对称性特点,提出一种用于唐卡图像的修复与预测方法;张东等人利用小波变换将图像分解成具有不同分辨率的低频分量和高频分量,进而根据高频分量的不同特征来修复具有丰富边缘和纹理的破损图像。该类方法适用于修复具有规则纹理的小尺度破损图像,若图像中的边缘和纹理过于复杂,基于纹理合成的方法则无法获得较高的修复质量。同时,上述三类典型方法尚无法抑制甲骨拓片图像中点状噪声、片状斑纹和固有纹理的干扰,甚至会在修复过程中引起更多伪边缘。
针对古文字字形的修复,张显俊等人提出了一种基于傅里叶描述子的书法碑刻文字字形修复方法,采用8-邻域搜索法对填充后的字形图像进行轮廓提取,得到连通的字形外轮廓,再利用基于傅立叶描述子的特征提取和边缘平滑技术对字形轮廓进行重构,获得了平滑后的碑刻文字轮廓。马小虎等人对甲骨文的字形轮廓进行特征点提取,并使用贝塞尔曲线拟合甲骨文字的轮廓,能够把图像形式的甲骨文转化为曲线轮廓描述的甲骨文,但是无法实现残损字形轮廓的修复。顾绍通提出了一种基于自适应阈值和分形几何的甲骨拓片字形复原方法,通过分析甲骨拓片的噪声特点以及甲骨字形边缘的分形特征,计算甲骨拓片图像边缘的分形维数并对甲骨文字边缘进行压缩变换,实现了甲骨拓片中文字边缘的自适应平滑。在此基础上,顾绍通等人引进泊松分布来刻画甲骨拓片图像的连通区域面积,提出了一种基于泊松分布和分形几何的甲骨拓片字形复原方法,通过比较每个连通区域与拓片上所有连通区域的数学期望的差值来识别拓片上的噪声区域,再根据甲骨拓片字形边缘的分形维数和字形轮廓线上当前点与左右相邻点形成的向量夹角,对甲骨拓片的文字区域进行判别,从而达到平滑甲骨字形边缘的目的。为了更好地保持被平滑了的文字边缘的分形特征,顾绍通进一步构造了一种分形插值函数,对提取到的甲骨文字特征点进行分形插值与逼近,进而在保留甲骨字形整体风格的同时,对文字边缘进行平滑。同时,顾绍通还提出了一种基于数学形态学的甲骨拓片字形复原方法,分别沿着水平方向、竖直方向以及斜线方向,对字形边缘进行基于形态学膨胀和腐蚀操作,从而平滑甲骨文字边缘的凹凸形态。不过,由于甲骨拓片中固有纹理和片状斑纹的分形维数与真正的甲骨文字往往存在一定相似性,上述两种方法仅对甲骨拓片图像上的点状噪声具有很好的抵抗能力,却对其固有纹理和片状斑纹的干扰不够鲁棒。
综上所述,目前尚没有一种可同时抵抗龟甲和兽骨上存在的点状噪声、片状斑纹和固有纹理干扰的,准确性高、鲁棒性好、处理速度快、具备自适应能力的甲骨刻辞文字自动修复方法。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种准确性高、鲁棒性好、处理速度快、具备自适应能力的基于形态先验特征的甲骨刻辞文字修复方法。
本发明的技术解决方案是:一种基于形态先验特征的甲骨刻辞文字修复方法,其特征在于按照如下步骤进行:
步骤1.输入待修复的甲骨文图像I,若与龟甲的盾纹、齿缝或甲骨外缘存在粘连的文字数量大于2,则令DenoiseOption←1,否则令DenoiseOption←0,所述DenoiseOption表示控制连通区域去噪强度的布尔型参数;
步骤2.将I的颜色空间从RGB转换到HSV,并提取其Y分量IV;
步骤3.利用迭代式全局阈值法分割IV,得到甲骨文字的粗分割结果;
步骤3.1令IV的最大灰度值和最小灰度值分别为Zmax和Zmin,并令初始分割阈值T1=(Zmax+Zmin)/2;
步骤3.2采用T1作为全局阈值将图像IV分割为前景区域G1和背景区域G2,其中,G1由IV中灰度值大于T1的像素组成,而G2由IV中灰度值不大于T1的像素组成;
步骤3.3计算前景区域G1中所有像素的平均灰度值μ1,计算背景区域G2中所有像素的平均灰度值μ2,并令T2=(μ1+μ2)/2;
步骤3.4如果|T2-T1|<T,所述T为预设的迭代阈值,则将T2作为最优的全局分割阈值,转入步骤3.5;否则,令T1←T2,转入步骤3.2;
步骤6.2若第i个4-连通区域的连通面积大于T4_Area,则将该4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.3,所述T4_Area为预设常数;
步骤6.3计算第i个4-连通区域的面积Si和外接矩形,令该外接矩形的高度和宽度分别为Hi和Wi;
步骤6.4若Si≥SE,则将第i个4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.5;
步骤6.5若Hi/Wi>Ratio或者Wi/Hi>Ratio,则将第i个4-连通区域判定为孤立的文字区域并转入步骤6.7,否则转入步骤6.6,所述Ratio为预设常数;
步骤6.6将第i个4-连通区域判定为噪声区域并将其填充为背景;
步骤6.7令i←i+1,若i>N4_Area,则转入步骤7,否则返回步骤6.1;
步骤9.2若像素q的值等于0或者像素q处于图像的第1行或第1列或最后1行或最后1列,则转入步骤9,否则转入步骤9.3;
步骤9.3若以像素q为中心的8-邻域相邻像素中,像素值为1的像素数量不足2个,则转入步骤9.8,否则根据公式(1)所定义的模板中的序号,对像素q的8-邻域相邻像素进行编号;
步骤9.5在集合Uedge中,找出能满足公式(2)的2个编号e1和e2;
所述e1∈{1,2,3,4,5,6,7,8},e2∈{1,2,3,4,5,6,7,8},且e1≠e2,表示以像素q为起点、以编号e1所对应的像素为终点的向量,表示以像素q为起点、以编号e2所对应的像素为终点的向量,分别表示和的模长,“·”表示向量的内积运算;
步骤9.6如果θ<θT,则将像素q判定为甲骨文字的拐点,所述θT为预设常数;
步骤9.7根据编号e1和e2,计算像素q的方向转角θq;
步骤9.7.1当e1=1时,若e2=3,则令θq=11,若e2=5,则令θq=2,若e2=6,则令θq=-12,若e2=7,则令θq=-3,若e2=8,则令θq=180,否则转入步骤9.8;
步骤9.7.2当e1=2时,若e2=4,则令θq=0,若e2=5,则令θq=0,若e2=6,则令θq=-3,若e2=7,则令θq=180,若e2=8,则令θq=3,否则转入步骤9.8;
步骤9.7.3当e1=3时,若e2=1,则令θq=11,若e2=4,则令θq=2,若e2=6,则令θq=180,若e2=7,则令θq=3,若e2=8,则令θq=12,否则转入步骤9.8;
步骤9.7.4当e1=4时,若e2=2,则令θq=0,若e2=3,则令θq=2,若e2=5,则令θq=180,若e2=7,则令θq=0,若e2=8,则令θq=-2,否则转入步骤9.8;
步骤9.7.5当e1=5时,若e2=1,则令θq=2,若e2=2,则令θq=0,若e2=4,则令θq=180,若e2=6,则令θq=-2,若e2=7,则令θq=0,否则转入步骤9.8;
步骤9.7.6当e1=6时,若e2=1,则令θq=-12,若e2=2,则令θq=-3,若e2=3,则令θq=180,若e2=5,则令θq=-2,若e2=8,则令θq=-11,否则转入步骤9.8;
步骤9.7.7当e1=7时,若e2=1,则令θq=-3,若e2=2,则令θq=180,若e2=3,则令θq=3,若e2=4,则令θq=0,若e2=5,则令θq=0,否则转入步骤9.8;
步骤9.7.8当e1=8时,若e2=1,则令θq=180,若e2=2,则令θq=3,若e2=3,则令θq=12,若e2=4,则令θq=-2,若e2=6,则令θq=-11,否则转入步骤9.8;
步骤10.2若像素m是甲骨文字的拐点,则将像素m作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素m设置为已被遍历过的像素并转入步骤10.7;
步骤10.3若像素m的右侧存在像素值等于1的像素,则继续沿着水平方向向右遍历,直到遇到第一个像素值等于0的像素m′为止,并将m′左侧的相邻像素m″作为当前边缘像素段的终止点,将m″的方向转角赋值给θend,令像素m″的坐标为(mx″,my″),所述mx″表示像素m″的横坐标,my″表示像素m″的纵坐标;
步骤11.1按照从左到右、从上到下的扫描顺序,扫描图像的每个像素,从中取出一个未经过竖直方向修复或者未被遍历过的像素,令其为n,并令其坐标为(nx,ny),所述nx表示像素n的横坐标,ny表示像素n的纵坐标;
步骤11.2若像素n是甲骨文字的拐点,则将像素n作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素n设置为已被遍历过的像素并转入步骤11.7;
步骤11.3若像素n的下方存在像素值等于1的像素,则继续沿着竖直方向向下遍历,直到遇到第一个像素值等于0的像素n′为止,并将n′上方的相邻像素n″作为当前边缘像素段的终止点,将n″的方向转角赋值给θend,令像素n″的坐标为(nx″,ny″),所述nx″表示像素n″的横坐标,ny″表示像素n″的纵坐标;
步骤12.2若像素k处于图像的第1行或第1列或最后1行或最后1列,则转入步骤12.4,否则转入步骤12.3;
步骤12.3若像素k的值等于1并且其8-邻域相邻像素的值均为0,则将像素k的值设置为0;
本发明第一,利用数学形态学运算、边缘梯度方向分析、边缘向量夹角最大化和连通性约束等手段,对甲骨文字的拐点、连通区域面积、连通区域形状和长宽比等局部特征进行提取,从而充分发掘甲骨刻辞文字的形态先验特征,能够有效抵抗龟甲和兽骨的固有纹理、点状噪声以及片状斑纹的干扰,实现对甲骨文字区域与噪声区域的准确判别;第二,利用基于4-链码的轮廓跟踪方法提取边缘像素段,并进一步利用边缘像素段的两个端点的方向转角之和来快速判别文字边缘的凹凸方向,进而对甲骨文字的凹凸边缘进行基于像素段平移的平滑修复,也就是将上凸的像素段下移、将下凹的像素段上移、将外凸的像素段内移、将内凹的像素段外移;第三,无需人工交互,可以批量自动处理甲骨文字图像,在时间效率上明显优于人工修复方法。因此,本发明具有抵抗点状噪声、片状斑纹和固有纹理干扰的,准确性高、鲁棒性好、处理速度快和自适应能力强等优点。
附图说明
图1是本发明对《甲骨文合集》19800号甲骨拓片图像的文字修复结果图。
图2是本发明对《甲骨文合集》20715号甲骨拓片图像的文字修复结果图。
图3是本发明对《甲骨文合集》17055正号甲骨拓片图像的文字修复结果图。
具体实施方式
本发明的一种基于形态先验特征的甲骨刻辞文字修复方法,按照如下步骤进行;
步骤1.输入待修复的甲骨文图像I,若与龟甲的盾纹、齿缝或甲骨外缘存在粘连的文字数量大于2,则令DenoiseOption←1,否则令DenoiseOption←0,所述DenoiseOption表示控制连通区域去噪强度的布尔型参数;
步骤2.将I的颜色空间从RGB转换到HSV,并提取其Y分量IV;
步骤3.利用迭代式全局阈值法分割IV,得到甲骨文字的粗分割结果;
步骤3.1令IV的最大灰度值和最小灰度值分别为Zmax和Zmin,并令初始分割阈值T1=(Zmax+Zmin)/2;
步骤3.2采用T1作为全局阈值将图像IV分割为前景区域G1和背景区域G2,其中,G1由IV中灰度值大于T1的像素组成,而G2由IV中灰度值不大于T1的像素组成;
步骤3.3计算前景区域G1中所有像素的平均灰度值μ1,计算背景区域G2中所有像素的平均灰度值μ2,并令T2=(μ1+μ2)/2;
步骤3.4如果|T2-T1|<T,所述T为预设的迭代阈值,本实施例令T=0.5,则将T2作为最优的全局分割阈值,转入步骤3.5;否则,令T1←T2,转入步骤3.2;
步骤6.2若第i个4-连通区域的连通面积大于T4_Area,则将该4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.3,所述T4_Area为预设常数,本实施例令T4_Area=500;
步骤6.3计算第i个4-连通区域的面积Si和外接矩形,令该外接矩形的高度和宽度分别为Hi和Wi;
步骤6.4若Si≥SE,则将第i个4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.5;
步骤6.5若Hi/Wi>Ratio或者Wi/Hi>Ratio,则将第i个4-连通区域判定为孤立的文字区域并转入步骤6.7,否则转入步骤6.6,所述Ratio为预设常数,本实施例令Ratio=2.5;
步骤6.6将第i个4-连通区域判定为噪声区域并将其填充为背景;
步骤6.7令i←i+1,若i>N4_Area,则转入步骤7,否则返回步骤6.1;
步骤9.2若像素q的值等于0或者像素q处于图像的第1行或第1列或最后1行或最后1列,则转入步骤9,否则转入步骤9.3;
步骤9.3若以像素q为中心的8-邻域相邻像素中,像素值为1的像素数量不足2个,则转入步骤9.8,否则根据公式(1)所定义的模板中的序号,对像素q的8-邻域相邻像素进行编号;
步骤9.5在集合Uedge中,找出能满足公式(2)的2个编号e1和e2;
所述e1∈{1,2,3,4,5,6,7,8},e2∈{1,2,3,4,5,6,7,8},且e1≠e2,表示以像素q为起点、以编号e1所对应的像素为终点的向量,表示以像素q为起点、以编号e2所对应的像素为终点的向量,分别表示和的模长,“·”表示向量的内积运算;
步骤9.6如果θ≤θT,则将像素q判定为甲骨文字的拐点,所述θT为预设常数,本实施例令θT=0.75π;
步骤9.7根据编号e1和e2,计算像素q的方向转角θq;
步骤9.7.1当e1=1时,若e2=3,则令θq=11,若e2=5,则令θq=2,若e2=6,则令θq=-12,若e2=7,则令θq=-3,若e2=8,则令θq=180,否则转入步骤9.8;
步骤9.7.2当e1=2时,若e2=4,则令θq=0,若e2=5,则令θq=0,若e2=6,则令θq=-3,若e2=7,则令θq=180,若e2=8,则令θq=3,否则转入步骤9.8;
步骤9.7.3当e1=3时,若e2=1,则令θq=11,若e2=4,则令θq=2,若e2=6,则令θq=180,若e2=7,则令θq=3,若e2=8,则令θq=12,否则转入步骤9.8;
步骤9.7.4当e1=4时,若e2=2,则令θq=0,若e2=3,则令θq=2,若e2=5,则令θq=180,若e2=7,则令θq=0,若e2=8,则令θq=-2,否则转入步骤9.8;
步骤9.7.5当e1=5时,若e2=1,则令θq=2,若e2=2,则令θq=0,若e2=4,则令θq=180,若e2=6,则令θq=-2,若e2=7,则令θq=0,否则转入步骤9.8;
步骤9.7.6当e1=6时,若e2=1,则令θq=-12,若e2=2,则令θq=-3,若e2=3,则令θq=180,若e2=5,则令θq=-2,若e2=8,则令θq=-11,否则转入步骤9.8;
步骤9.7.7当e1=7时,若e2=1,则令θq=-3,若e2=2,则令θq=180,若e2=3,则令θq=3,若e2=4,则令θq=0,若e2=5,则令θq=0,否则转入步骤9.8;
步骤9.7.8当e1=8时,若e2=1,则令θq=180,若e2=2,则令θq=3,若e2=3,则令θq=12,若e2=4,则令θq=-2,若e2=6,则令θq=-11,否则转入步骤9.8;
步骤10.2若像素m是甲骨文字的拐点,则将像素m作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素m设置为已被遍历过的像素并转入步骤10.7;
步骤10.3若像素m的右侧存在像素值等于1的像素,则继续沿着水平方向向右遍历,直到遇到第一个像素值等于0的像素m′为止,并将m′左侧的相邻像素m″作为当前边缘像素段的终止点,将m″的方向转角赋值给θend,令像素m″的坐标为(mx″,my″),所述mx″表示像素m″的横坐标,my″表示像素m″的纵坐标;
步骤11.1按照从左到右、从上到下的扫描顺序,扫描图像的每个像素,从中取出一个未经过竖直方向修复或者未被遍历过的像素,令其为n,并令其坐标为(nx,ny),所述nx表示像素n的横坐标,ny表示像素n的纵坐标;
步骤11.2若像素n是甲骨文字的拐点,则将像素n作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素n设置为已被遍历过的像素并转入步骤11.7;
步骤11.3若像素n的下方存在像素值等于1的像素,则继续沿着竖直方向向下遍历,直到遇到第一个像素值等于0的像素n′为止,并将n′上方的相邻像素n″作为当前边缘像素段的终止点,将n″的方向转角赋值给θend,令像素n″的坐标为(nx″,ny″),所述nx″表示像素n″的横坐标,ny″表示像素n″的纵坐标;
步骤12.2若像素k处于图像的第1行或第1列或最后1行或最后1列,则转入步骤12.4,否则转入步骤12.3;
步骤12.3若像素k的值等于1并且其8-邻域相邻像素的值均为0,则将像素k的值设置为0;
从《甲骨文合集》中选取3幅甲骨拓片图像,采用本发明进行甲骨文字修复的结果分别如图1-图3所示,其中,图1(a)、图2(a)和图3(a)为原始甲骨拓片图像,图1(b)、图2(b)和图3(b)为采用本发明将背景和噪声区域填充后的图像,图1(c)、图2(c)和图3(c)分别为图1(b)、图2(b)、图3(b)中用白色矩形框标出的文字的原始边缘,图1(d)、图2(d)和图3(d)分别为图1(b)、图2(b)、图3(b)中用白色矩形框标出的文字采用本发明修复后的边缘。
从图1-图3可见,本发明能够在保留文字区域的基础上,有效地去除龟甲和兽骨上的点状噪声、片状斑纹和固有纹理。而且,本发明完整地保持了甲骨文字的字形特点,消除了文字边缘的毛刺、凸起和锯齿,实现了文字边缘的平滑处理,进而更加有利于提高后续的甲骨文字自动识别的精度。
Claims (1)
1.一种基于形态先验特征的甲骨刻辞文字修复方法,其特征在于按照如下步骤进行:
步骤1.输入待修复的甲骨文图像I,若与龟甲的盾纹、齿缝或甲骨外缘存在粘连的文字数量大于2,则令DenoiseOption←1,否则令DenoiseOption←0,所述DenoiseOption表示控制连通区域去噪强度的布尔型参数;
步骤2.将I的颜色空间从RGB转换到HSV,并提取其Y分量IV;
步骤3.利用迭代式全局阈值法分割IV,得到甲骨文字的粗分割结果;
步骤3.1令IV的最大灰度值和最小灰度值分别为Zmax和Zmin,并令初始分割阈值T1=(Zmax+Zmin)/2;
步骤3.2采用T1作为全局阈值将图像IV分割为前景区域G1和背景区域G2,其中,G1由IV中灰度值大于T1的像素组成,而G2由IV中灰度值不大于T1的像素组成;
步骤3.3计算前景区域G1中所有像素的平均灰度值μ1,计算背景区域G2中所有像素的平均灰度值μ2,并令T2=(μ1+μ2)/2;
步骤3.4如果|T2-T1|<T,所述T为预设的迭代阈值,则将T2作为最优的全局分割阈值,转入步骤3.5;否则,令T1←T2,转入步骤3.2;
步骤6.2若第i个4-连通区域的连通面积大于T4_Area,则将该4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.3,所述T4_Area为预设常数;
步骤6.3计算第i个4-连通区域的面积Si和外接矩形,令该外接矩形的高度和宽度分别为Hi和Wi;
步骤6.4若Si≥SE,则将第i个4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.5;
步骤6.5若Hi/Wi>Ratio或者Wi/Hi>Ratio,则将第i个4-连通区域判定为孤立的文字区域并转入步骤6.7,否则转入步骤6.6,所述Ratio为预设常数;
步骤6.6将第i个4-连通区域判定为噪声区域并将其填充为背景;
步骤6.7令i←i+1,若i>N4_Area,则转入步骤7,否则返回步骤6.1;
步骤9.2若像素q的值等于0或者像素q处于图像的第1行或第1列或最后1行或最后1列,则转入步骤9,否则转入步骤9.3;
步骤9.3若以像素q为中心的8-邻域相邻像素中,像素值为1的像素数量不足2个,则转入步骤9.8,否则根据公式(1)所定义的模板中的序号,对像素q的8-邻域相邻像素进行编号;
步骤9.5在集合Uedge中,找出能满足公式(2)的2个编号e1和e2;
所述e1∈{1,2,3,4,5,6,7,8},e2∈{1,2,3,4,5,6,7,8},且e1≠e2,表示以像素q为起点、以编号e1所对应的像素为终点的向量,表示以像素q为起点、以编号e2所对应的像素为终点的向量,分别表示和的模长,“·”表示向量的内积运算;
步骤9.6如果θ<θT,则将像素q判定为甲骨文字的拐点,所述θT为预设常数;
步骤9.7根据编号e1和e2,计算像素q的方向转角θq;
步骤9.7.1当e1=1时,若e2=3,则令θq=11,若e2=5,则令θq=2,若e2=6,则令θq=-12,若e2=7,则令θq=-3,若e2=8,则令θq=180,否则转入步骤9.8;
步骤9.7.2当e1=2时,若e2=4,则令θq=0,若e2=5,则令θq=0,若e2=6,则令θq=-3,若e2=7,则令θq=180,若e2=8,则令θq=3,否则转入步骤9.8;
步骤9.7.3当e1=3时,若e2=1,则令θq=11,若e2=4,则令θq=2,若e2=6,则令θq=180,若e2=7,则令θq=3,若e2=8,则令θq=12,否则转入步骤9.8;
步骤9.7.4当e1=4时,若e2=2,则令θq=0,若e2=3,则令θq=2,若e2=5,则令θq=180,若e2=7,则令θq=0,若e2=8,则令θq=-2,否则转入步骤9.8;
步骤9.7.5当e1=5时,若e2=1,则令θq=2,若e2=2,则令θq=0,若e2=4,则令θq=180,若e2=6,则令θq=-2,若e2=7,则令θq=0,否则转入步骤9.8;
步骤9.7.6当e1=6时,若e2=1,则令θq=-12,若e2=2,则令θq=-3,若e2=3,则令θq=180,若e2=5,则令θq=-2,若e2=8,则令θq=-11,否则转入步骤9.8;
步骤9.7.7当e1=7时,若e2=1,则令θq=-3,若e2=2,则令θq=180,若e2=3,则令θq=3,若e2=4,则令θq=0,若e2=5,则令θq=0,否则转入步骤9.8;
步骤9.7.8当e1=8时,若e2=1,则令θq=180,若e2=2,则令θq=3,若e2=3,则令θq=12,若e2=4,则令θq=-2,若e2=6,则令θq=-11,否则转入步骤9.8;
步骤10.2若像素m是甲骨文字的拐点,则将像素m作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素m设置为已被遍历过的像素并转入步骤10.7;
步骤10.3若像素m的右侧存在像素值等于1的像素,则继续沿着水平方向向右遍历,直到遇到第一个像素值等于0的像素m′为止,并将m′左侧的相邻像素m″作为当前边缘像素段的终止点,将m″的方向转角赋值给θend,令像素m″的坐标为(mx″,my″),所述mx″表示像素m″的横坐标,my″表示像素m″的纵坐标;
步骤11.1按照从左到右、从上到下的扫描顺序,扫描图像的每个像素,从中取出一个未经过竖直方向修复或者未被遍历过的像素,令其为n,并令其坐标为(nx,ny),所述nx表示像素n的横坐标,ny表示像素n的纵坐标;
步骤11.2若像素n是甲骨文字的拐点,则将像素n作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素n设置为已被遍历过的像素并转入步骤11.7;
步骤11.3若像素n的下方存在像素值等于1的像素,则继续沿着竖直方向向下遍历,直到遇到第一个像素值等于0的像素n′为止,并将n′上方的相邻像素n″作为当前边缘像素段的终止点,将n″的方向转角赋值给θend,令像素n″的坐标为(nx″,ny″),所述nx″表示像素n″的横坐标,ny″表示像素n″的纵坐标;
步骤12.2若像素k处于图像的第1行或第1列或最后1行或最后1列,则转入步骤12.4,否则转入步骤12.3;
步骤12.3若像素k的值等于1并且其8-邻域相邻像素的值均为0,则将像素k的值设置为0;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010775134.6A CN112070684B (zh) | 2020-08-04 | 2020-08-04 | 基于形态先验特征的甲骨刻辞文字修复方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010775134.6A CN112070684B (zh) | 2020-08-04 | 2020-08-04 | 基于形态先验特征的甲骨刻辞文字修复方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112070684A true CN112070684A (zh) | 2020-12-11 |
CN112070684B CN112070684B (zh) | 2023-05-23 |
Family
ID=73656871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010775134.6A Active CN112070684B (zh) | 2020-08-04 | 2020-08-04 | 基于形态先验特征的甲骨刻辞文字修复方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112070684B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113362361A (zh) * | 2021-07-20 | 2021-09-07 | 辽宁师范大学 | 形态学先验约束的甲骨文字检测的图像数据集构建方法 |
CN114494306A (zh) * | 2022-01-27 | 2022-05-13 | 辽宁师范大学 | 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170132764A1 (en) * | 2015-11-06 | 2017-05-11 | Industrial Technology Research Institute | Image inpainting system and method for using the same |
CN110309830A (zh) * | 2019-06-04 | 2019-10-08 | 辽宁师范大学 | 基于数学形态学和区域连通性的甲骨文字自动分割方法 |
CN111292283A (zh) * | 2020-01-21 | 2020-06-16 | 河南大学 | 一种基于时间序列相似性计算的甲骨残片缀合方法 |
CN111310760A (zh) * | 2020-02-13 | 2020-06-19 | 辽宁师范大学 | 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法 |
-
2020
- 2020-08-04 CN CN202010775134.6A patent/CN112070684B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170132764A1 (en) * | 2015-11-06 | 2017-05-11 | Industrial Technology Research Institute | Image inpainting system and method for using the same |
CN110309830A (zh) * | 2019-06-04 | 2019-10-08 | 辽宁师范大学 | 基于数学形态学和区域连通性的甲骨文字自动分割方法 |
CN111292283A (zh) * | 2020-01-21 | 2020-06-16 | 河南大学 | 一种基于时间序列相似性计算的甲骨残片缀合方法 |
CN111310760A (zh) * | 2020-02-13 | 2020-06-19 | 辽宁师范大学 | 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113362361A (zh) * | 2021-07-20 | 2021-09-07 | 辽宁师范大学 | 形态学先验约束的甲骨文字检测的图像数据集构建方法 |
CN113362361B (zh) * | 2021-07-20 | 2023-09-05 | 辽宁师范大学 | 形态学先验约束的甲骨文字检测的图像数据集构建方法 |
CN114494306A (zh) * | 2022-01-27 | 2022-05-13 | 辽宁师范大学 | 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法 |
CN114494306B (zh) * | 2022-01-27 | 2024-04-05 | 辽宁师范大学 | 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112070684B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310760B (zh) | 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法 | |
CN106709964B (zh) | 基于梯度修正和多向纹理提取的素描画生成方法及装置 | |
CN109241973B (zh) | 一种纹理背景下的字符全自动软分割方法 | |
CN108830857B (zh) | 一种自适应的汉字碑帖图像二值化分割方法 | |
CN102289668A (zh) | 基于像素邻域特征的自适应文字图像的二值化处理方法 | |
CN104834890B (zh) | 一种对书法作品中文字神采信息的提取方法 | |
CN108399644A (zh) | 一种墙体图像识别方法及其装置 | |
CN112070684B (zh) | 基于形态先验特征的甲骨刻辞文字修复方法 | |
CN110309830B (zh) | 基于数学形态学和区域连通性的甲骨文字自动分割方法 | |
CN114494306B (zh) | 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法 | |
CN107578039A (zh) | 基于数字图像处理技术的字迹轮廓比对方法 | |
CN113538498A (zh) | 一种基于局部二值化的印章图像分割方法、电子设备和可读存储介质 | |
CN115578741A (zh) | 一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法 | |
CN105373798B (zh) | 一种基于k近邻抠图和数学形态学的书法字提取方法 | |
Lin et al. | License plate location method based on edge detection and mathematical morphology | |
CN107609482B (zh) | 一种基于汉字笔画特征的中文文本图像倒置判别方法 | |
EP2223265A1 (en) | A method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character | |
CN112712860A (zh) | 一种基于真实金相图结构的晶粒有限元模型建模方法 | |
CN107784626B (zh) | 一种基于单幅图像的三维数字凹浮雕生成方法 | |
CN113643290B (zh) | 一种基于图像处理的吸管计数方法、装置及存储介质 | |
Khan et al. | Segmentation of single and overlapping leaves by extracting appropriate contours | |
CN114445814A (zh) | 一种字符区域提取方法、计算机可读存储介质 | |
CN111476800A (zh) | 一种基于形态学操作的文字区域检测方法及装置 | |
KR20200092115A (ko) | 비석 글자 새김 추출 시스템 및 방법 | |
Boussellaa et al. | PRAAD: preprocessing and analysis tool for Arabic ancient documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |