具体实施方式
下面结合附图对本发明做进一步说明。
在三个不同的位置对石刻文字进行拍照,然后从三幅照片中利用摄影测量技术测量出文字三维尺寸,在三幅图像中选择文字平面与像平面最接近的一幅图像进行失真校正,然后对校正后的图像进行文字分割。然后利用实物拓片背景样本或岩石图像样本进行拓片的背景建模,将分割后的字体与拓片背景融合,接着采用墨汁与宣纸的扩散渗透过程模拟拓片效果,最后完成数字拓片的制作,整个流程如图1所示。
1.石刻文字图像拍摄
在拍摄石刻文字图像时,需要在石刻附近放置尺寸已知的标志板,标志板上的特征几何图案如图2和图3所示,方形及圆环形的尺寸及数量根据石刻的大小改变,标志板制作时将图2和图3所示的图案按1:1打印后粘贴到平面板材上即可。拍摄相机采用2000万像素以上的数码单反相机,相机镜头焦距范围10mm至800mm之间。拍摄时需要在至少三个不同的角度对石刻文字进行拍照,每个视角间的角度大于20度,如图4所示。
2.石刻文字图像校正
由于拍摄角度等原因,石刻平面和相机图像平面并不平行,图像中的文字将发生仿射和摄影失真,需要利用图像校正方法消除拍摄图像中的仿射和射影失真。石刻文字雕刻于平面石板或非平面的石头表面,对于平面上的石刻文字,利用横向或纵向有规则排列的文字上下或左右边界线构成平行线的消失点进行图像的校正;对于行书或草书可以利用文字包围盒的四周平行线构成的平行线消失点进行图像校正;如果图像中无法自动获取具有平行线的特征,可以手动加入平行线特征。根据石刻平面和图像平面上两点X,x的投影关系可以得到:X=H-1x=MSMAMPx,其中MS,MA,MP分别为相似矩阵、仿射矩阵和投影矩阵。
投影矩阵定义为
其中l
∞=(l
1l
2l
3)
T是连个消失点构成的消失线。将投影矩阵作用到图像后,仿射矩阵可以定义为:
如果已知世界平面上的两条直线l=(l
1l
2l
3)和m=(m
1m
2m
3)间的夹角为θ,α,β位于以(c
α,c
β)为圆心的圆上:
此圆半径为
其中α=-l
2/l
1,b=-m
2/m
1。利用一对已知夹角或长度比或其组合计算出两个圆,其交点即为(α,β)。
相似矩阵可以用如下公式计算: s为比例因子,R为旋转矩阵,t为平移向量。计算出MP,MA,MS后,即可计算出射影变换矩阵H-1。
对于刻在曲面岩石上的石刻,可以利用专利US2012/0134588A1中提出的基于变换不变的低秩结构(transform invariant low-rank texture,TILT)的文字校正方法将曲面石刻字体的姿态进行校正。石刻中单个文字图像D由低秩矩阵A和稀疏误差矩阵E构成,即
D=A+E (1)
字符图像可以当做低秩结构处理,字符的变形τ可以通过求解如下的最优化问题得到:
优化的校正变换τ可以通过线性化方程(1)计算τ的增量Δτ迭代求解获得,即:
采用交替方向法(alternating direction method,ADM)可以对公式(3)进行高效的求解,即:
对于图像中的多个文字同时校正的情况可以通过如下的最优化方法计算得到:
s.t.Doτ+JΔτ=A+E,A=[A1,…,An].
可以通过最小化增量朗格朗日函数求解上式,即:
此外,采用Liang等[J.Liang PAMI2007]提出的文献图像的几何校正方法、Yamashita等[Yamashita ICPR2004]提出的利用立体视觉恢复曲面文字信息、Zhang等[Zhang CVPR2004]提出的基于三维形状建模的弯曲文献图像恢复等方法也可实现石刻文字的校正。石刻文字图像校正实例如图5所示。
3.石刻文字图像分割
为了利用高分辨率相机拍摄石刻的数字图像提取具有真实感的拓片图像,首先需要将石刻文字从图像中分割出来。由于岩石色彩、质地、纹理千差万别,需要根据不同的岩石背景特征进行石刻文字分割。首先对图像进行中值滤波或双边滤波处理,去除部分噪声,对于噪声较少的背景,采用Ostu自动阈值分割方法,分割出字体,再利用数学形态学腐蚀、膨胀算子去除背景中的多余干扰点。
对于边界较清晰但包含较多噪声的石刻图像,采用基于水平集(Levelset)的方法把文字从噪声图像中分割出来。Level set方法将n维曲面的演化问题转化为n+1维空间的水平集函数曲面演化的隐含方式求解,水平集方法先给定一个封闭初始轮廓线,然后该初始轮廓线在一系列内力和外力的作用下一步步逼近石刻目标字体,最后根据一定的约束条件停止在待分割部分的边缘上,完成分割。水平集函数一般表达为一个偏微分方程:
V
ext与图像梯度信息紧密相关,给定初始几何活动轮廓曲线C(p,0)和轮廓曲线演化的偏微分方程,通过水平集函数随时间的运动满足φ(C(t),t)=0。可以采用的方法有Brox等[Brox PR2004]提出的基于水平集的多区域图像分割方法、Manjusha等[Manjusha,IJCA2012]提出的基于水平集和非线性融合的字符分割方法、Moghaddam等[Moghaddam,ICDAR2009]提出的基于水平集和多层分类器的退化字符恢复和分割方法。
对于边界较模糊的图像可以采用基于纹理的图像分割方法提取出石刻中的文字,岩石具有丰富的纹理,而且这种纹理与石刻文字纹理有较大差异,采用基于纹理的字符分割方法将获得非常好的提取效果。可以采用Liu等[Liu,IEEE TIP2006]提出的基于局部光谱直方图的图像纹理分割方法。
对于长期经过风化的残缺字体,需要利用手动分割的方式,将其与背景分离出来。分割出的文字用黑色背景白字字体表示。整个石刻文字图像的分割流程如图6所示。
校正后的图像利用中值滤波、双边滤波等滤波器进行去噪平滑处理,然后根据图像的特征分别选用基于Ostu的自动阈值分割、基于水平集的文字分割、基于纹理的分割和基于手动交互分割方法,进行图像的文字的分割处理,对处理有噪声的图像采用数学形态学处理,去除多余噪声,得到清晰的文字轮廓图像。水平集石刻文字图像分割实例如图7所示。
4.数字拓片背景建模
拓片背景建模可以采用两种技术,第一种将现有手工拓片背景利用高分辨率扫描仪进行扫描,获得具有不同纹理特征的拓片背景图像,为获得大分辨率的背景图像,需要将多张子背景图像拼接在一起。但由于实物拓片背景在制作时颜色深浅不一,或者在图像拍摄时候的光线变化,都将引起每张子背景图像的色阶不同,在图像拼接前需要将对每张背景纹理子图像色阶统一。色阶调整计算公式为:
具体计算时首先选择一张子图像作为参考图像,以其黑色部分像素为基准,方法如下:
(1)分别对参考图像和目标图像的各个通道求其均值,为Inew1和Iold2。
(2)再对两幅图片像素值小于均值部分再求一次平均值,为Inew3和Iold4,根据公式(5)求得其对应关系参数σ。
(3)再通过公式(5)和所得参数σ对目标图像进行色阶变换。
实验表明经过调色阶整后,目标图像的颜色与参考图像基本一致。
各实物拓片纹理子图像经过色阶统一后,利用纹理合成方法拼接起来即可构成一张大分辨率的拓片背景图像,具体方法利用基于狄利克雷边界条件的泊松微风方程公式推导得到图片插值公式如下:
其中f
p为需插值区域中p点的像素值,N
p为p的邻域,|N
p|为邻域数目(一般为4),Ω为边界,
是q点处于边界外的图片像素值,v
pq是插值引导向量场。这里考虑到两幅图片都有边界,为了较好的过渡,设为带权重的梯度值,取为
其中n为重叠区域大小,i为变量循环参数,i∈[1,n-1]。当然可以根据具体图片来设置n和v
pq,若图片重叠区域差别不大,则可以把n取小一点,减小模糊,v
pq也可以取为图像的梯度。设图片为具有m个需插值点,即m个未知数,则共有m个线性方程,这样就可以解得所需区域的像素值。需要注意的是对各个点进行分类,考虑其邻域点数和位置。若在内部,则没有
在外部,则有
从中间截取小块图像放大后可以拼接处没有明显的拼接痕迹。其它图像拼接方法也可用在纹理子图像的拼接中,其目的是消除不同图像拼接的痕迹,如图8、9、10所示。
为了生成更丰富的数字拓片背景效果,从实物拓片的高清扫描图像中截取具有拓片背景特征的子图像块,将子背景图像块随机排列后再利用多纹理合成方法将子背景图像融合成一张完整的拓片背景图。
数字拓片纹理背景生成的第二种方法首先将岩石彩色图像变为灰度图像,而且采用动态阈值和图像色阶调整,将灰度图像变为类二值图像,(类二值图像是指图像中的象素灰度大部分集中在0和255附近,但图像仍然是256阶灰度的图像,并非二值图像),这样处理的目的是为能更加逼真地模拟拓片背景效果,如图11、12所示。
上述得到的背景图像并不能真实地反映宣纸与墨汁相互渗透和作用的效果,因此还需要对类二值背景图像做进一步的处理。通过表面化学和纺织工业中对吸附和扩散过程研究得出的定性规律和定量方程,能够定量、高精度地模拟岩石突起颗粒和宣纸接触后的渗透和扩散过程。当岩石突起颗粒和宣纸接触时,墨汁溶液就会发生交互作用,墨汁颗粒开始在两相交界处进行迁徙,可以采用表面化学工程中的Dubinin-Radushkevich(杜比宁)等温线方程模拟该过程,该方程的优点在于正好对拓片时的压力对吸附过程进行了准确的建模:
其中ρ是墨汁颗粒浓度;Δρ是整个吸附过程中墨迹浓度发生的变化量;kG是气体常数,即8.314J/(mol.K);T为温度,一般设为常数;β为亲和系数,用于表征被吸附物质的极化度;E0为吸收剂的吸附特征能量,其主要取决于宣纸的毛孔密度;Pmax为压力感应系数;P为岩石颗粒与宣纸间接触区域的局部压力。采用如下的公式以保证吸附过程中墨汁颗粒的质量守恒:
其中
为岩石颗粒在石刻t与宣纸上位置(x,y)相接触点的瞬时局部速度,η
x,y为宣纸上位置(x,y)处的纤维密度。为避免吸附过程陷入数值计算振荡,引入吸附过程中可以迁移的墨汁颗粒总量上限,该极限值由以下方程导出:
通过求解上式可以计算出上限值
即
利用上述的墨汁渗透过程,将类二值图像中白色区域边缘生成墨汁渗透和扩散效果,获得更加具有逼真效果的拓片背景图像。
5.石刻字体的三维尺寸测量
石刻文字的三维尺寸,可以利用摄影测量技术测量出文字的三维尺寸。对石刻字体进行拍摄时,需要在石刻旁边放置特征点尺寸已知的标志板,需在不同角度拍摄至少三张图像。我们知道一般石刻文字都刻在平面岩石上,因此如果计算出石刻平面上x、y两个方向的尺寸,那么平面上所有字体的尺寸就能计算出来。具体实施时首先利用标志板信息计算相机的参数,利用相机内外参数计算出图像上石刻字体平面x、y两个方向上的一个距离值(可以采用字体包围盒的x、y方向的两个边作为计算单元),最后根据文字图像的包围盒尺寸即可计算出文字实际的真实尺寸。
在提取标志板角点时为保证系统的稳定性和准确性,本发明中采用手动方式选取标志板棋盘格的三个顶点(第四个顶点自动计算),然后根据棋盘格的大小,自动计算出其余棋盘格角点像素精度的坐标,记为q,然后以q为中心的一个邻域窗口内的像素记为pi,由q和pi构成的矢量与pi点的梯度正交,可以在pi点的周围找到多组梯度及相关向量qipi,令其点积为0,通过求解方程组获得亚像素精度的角点坐标q。计算出标志板上的角点图像坐标后,可以利用张氏标定方法,计算出相机参数及投影矩阵元素ai;j。
根据相机投影关系得到关于投影矩阵元素ai,j的线性方程:
计算出相机标定参数和投影矩阵及图像空间的匹配点集,将上式变换为:
对统一标识点列方程转化为矩阵形式为:
其中,X,Y,Y为空间点的三维坐标,a
i,j,b
i,j分别为两幅图像投影矩阵元素,u
1,v
1为标记点在左图中的亚像素图像坐标,u
2,v
2为标记点在右图中的亚像素坐标,4个方程解算3个未知数,采用最小二乘法计算出最优解即可得到图像上点的三维空间坐标。根据相机参数及对应点
及
计算出石刻平面上VA、VB的长度,石刻平面上其他文字的尺寸,可以根据同样的方法技术获得,如图13、14所示。
此外,对位于石灰岩悬崖峭壁上的摩崖石刻,人及物体均不可接近,可以先利用长焦高倍镜头拍摄石刻图像,再利用激光测距仪或全站仪等辅助设备获得石刻平面内x、y两个方向标志尺寸,石刻上其他文字尺寸可以据此推算出来。
6.背景图像和分割石刻文字的融合
将文字图像和背景图像设置为相同大小分辨率,在文字图像上将灰度值为(0,0,0)的像素的α通道设置为全透明,即α=0,然后将文字图像和背景图像融合得到新的图像。
7.分割字体图像的墨水渗透扩散和数字拓片生成
将背景图像和分割后的字体图像融合后,并不能真实地反应在人工拓片过程中的墨水与宣纸的相互渗透扩散的过程。需要采用数字化的方法模拟出字体边缘墨水与宣纸上的扩散及宣纸的吸附和沉降过程。为了模拟墨水在宣纸表面的扩散行为,将其建模为一个物质扩散过程,利用对流扩散方程以定量地表达墨水渗透过程。为更加符合物理现实,在模拟中采用动态扩散系数的方法,即扩散系数除了受宣纸纤维结构的影响外,纸张某点处的墨水扩散系数还取决于水的浓度,胶质浓度和纸纤维的密度。在墨水扩散中,速度相对较低的墨水颗粒会固着在具有较高表面自由能的纸张纤维中,这个现象是典型的吸附过程,采用描述平衡系统状态的Langmuir(朗缪尔)等温线方程来模拟吸附过程。墨汁颗粒的沉淀过程主要是由发生扩散过程的物质颗粒的随机流动所导致,可进一步用一个流动系数来调整。最后采用Dubini-Radushkevich方程对离散模拟时间段进行先行近似的简化处理,再用一个类似的方法来快速得到扩散过程中。通常利用描述平衡系统的Langmuir等温线方程模拟吸附过程:
利用一个线性过程快速得到快速吸附过程中为达到平衡态时的中间状态,具体用下式表示:
其中
是时刻t纸张位置(x,y)处于固定态的第i种墨水颗粒的浓度,x是达到稳定状态所需要的沉降时间。为了保证沉降过程中墨汁颗粒的质量守恒,需引入墨汁颗粒迁移过程的质量守恒关系:
将图像分割后的字体进行墨汁的渗透和扩散,模拟墨汁和宣纸相互作用的效果,最后将处理后的字体和建模的拓片背景图像进行融合,即获得具有真实感的数字拓片效果图像。上述过程可以对现有石刻进行完整真实的三维数字化,从而实现永久保存和挽救性再现雕刻。
本发明具有以下优势:
非接触式数据采集,不会对文物造成任何破坏性影响;
无油墨拓片、一次采样,减少对石刻及环境的污染;
数字成像,便于重复利用,极大减少人工成本;
数字压缩保存,极大减少存储空间;
真实再现,可完美修复和异地再造,循环经济和可持续发展。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。