CN112837334B

CN112837334B - 一种汉简图像的自动缀合方法

Info

Publication number: CN112837334B
Application number: CN202110361268.8A
Authority: CN
Inventors: 张重生; 侯亚新; 姚磊
Original assignee: Henan University
Current assignee: Henan University
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2022-07-05
Anticipated expiration: 2041-04-02
Also published as: CN112837334A

Abstract

本发明公开了一种汉简图像的自动缀合方法，包括以下步骤：A：依据缺失部位信息对汉简图像进行分组；B：提取汉简图像的边缘线；C：获取边缘线骨架；D：测量边缘线骨架图像的宽度及高度；E：计算出每边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例；F：得到每幅汉简图像对应的边缘线骨架标注图像；G：得到二维数值型的时间序列化数据；H：得到二维时间序列化数据；I：得到归一化后的时间序列化边缘曲线数据；J：利用归一化后的时间序列化边缘曲线数据计算两幅汉简图像的相似度；K：返回与汉简图像a相似度最高的前N幅图像。本发明能够极大地提高了汉简图像缀合的效率和准确性。

Description

一种汉简图像的自动缀合方法

技术领域

本发明涉及一种断裂物品的图像拼合方法，尤其涉及一种汉简图像的自动缀合方法。

背景技术

汉简是研究汉王朝与丝绸之路沿途各国在政治、经济、军事、文化等方面交流的重要材料，汉简图像则是进行汉简研究的主要材料。在汉简研究的专业领域中，原边是指竹简的天然侧边，一般比较平滑和规则，原边可以是直线或有微小的弧度，而断边则非天然存在，是竹简断裂后在断裂处形成的边。

现有的汉简研究过程中，研究专家通常利用领域专业知识手工缀合汉简，通过对两块汉简断边碴口密合度进行观察分析，以判别两块汉简是否由同一块汉简断裂而成。上述手工缀合方法的准确性和效率较低，且工作强度较大。

发明内容

本发明的目的是提供一种汉简图像的自动缀合方法，能够利用两块汉简的宽度、高度和厚度等物理尺寸信息，充分考虑两块汉简拼合后的上下表面的平滑性，极大地提高了汉简图像缀合的效率和准确性。

本发明采用下述技术方案：

一种汉简图像的自动缀合方法，包括以下步骤：

A：对汉简图像进行人工分类，依据汉简图像对应的汉简的缺失部位信息对汉简图像进行分组；汉简图像的缺失部位信息包括缺上、缺下、缺左和缺右四种情况；然后将缺下分组中的汉简图像与缺上分组中的汉简图像进行缀合，将缺左分组中的汉简图像与缺右分组中的汉简图像进行缀合；

B：对汉简图像进行边缘检测以提取汉简图像的边缘线，得到每幅汉简图像对应的边缘线图像；

C：获取每幅汉简图像所对应的边缘线图像中的边缘线骨架，得到每幅汉简图像所对应的边缘线骨架图像，边缘线骨架指边缘线中居中的像素点；

D：测量汉简图像所对应的边缘线骨架图像的宽度及高度；

E：根据每幅汉简的真实物理尺寸信息，结合步骤D中得到的每幅汉简图像所对应的边缘线骨架图像的宽度和高度，分别计算得出每幅汉简图像所对应的边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例，分别记为γ₁和γ₂；其中，

β₁为边缘线骨架图像的宽度值与汉简的真实宽度值的倍数关系，β₂为边缘线骨架图像的高度值与汉简的真实高度值的倍数关系；

F：人工确定每幅汉简图像的边缘线骨架图像中的断边部分，得到每幅汉简图像对应的边缘线骨架标注图像；

G：对步骤F中得到的边缘线骨架标注图像中边缘线骨架的断边部分进行时间序列化处理，得到对应的二维数值型的时间序列化数据T；

T＝{(V₁,W₁),(V₂,W₂),(V₃,W₃),…,(V_i,W_i)}，i为正整数，(V_i,W_i)表示边缘线骨架的断边部分的第i个像素数据的像素位置；

H：利用步骤E中得到每幅汉简图像所对应的边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例γ₁和γ₂，将步骤G中得到的每幅汉简图像的边缘线骨架的断边部分所对应的二维时间序列化数据T，转化为每幅汉简图像的边缘线骨架的断边部分恢复到真实物理尺寸后的二维时间序列化数据T′，T′＝{(V′₁,W′₁),(V′₂,W′₂),(V₃′,W′₃),…,(V′_i,W′_i)}，i为正整数，(V′_i,W′_i)表示恢复到真实物理尺寸后的断边部分第i个像素数据的像素位置；

I：将步骤H中得到的二维时间序列化数据T′中的V′_i和W′_i分别进行归一化处理，得到归一化后的时间序列化边缘曲线数据T”_v和T”_w，T”_v＝{V”₁,V”₂,V”₃,…,V”_i}，T”_w＝{W”₁,W”₂,W”₃,…,W”_i}，i为正整数；

J：对两幅待缀合的汉简图像，根据步骤I中得到的边缘线骨架的断边部分经归一化处理后的时间序列化边缘曲线数据T″_v和T″_w，计算两幅汉简图像的相似度：

计算两幅汉简图像的相似度时，对于缺上和缺下的分组中拟判定是否能够缀合的两幅汉简图像a和b对应的经归一化处理后的时间序列化边缘曲线数据T″_wa与T″_wb，先将汉简图像a和b放置到一幅新的空白图像c中，先后对汉简图像a和b的断边部分进行左对齐和右对齐，且T″_wa均在上方，T″_wb均在下方；在左对齐和后对齐后，保持汉简图像a在图像c中固定不变，先将汉简图像b以M像素为步幅在图像c中沿水平方向在设定的滑动范围内向左滑动，然后回到初始位置，最后沿水平方向在设定的滑动范围内向右滑动；在汉简图像b每次滑动后，计算两幅汉简图像a和b对应的归一化处理后的时间序列化边缘曲线数据T″_wa与T″_wb在水平方向上重合部分的子曲线T″_was与T″_wbs之间的时间序列匹配度s，并将时间序列匹配度s放入集合S中；最后求集合S中的最大值，即为汉简图像a和b之间的最大缀合度；

对于缺左和缺右的分组中拟判定是否能够缀合的两幅汉简图像a和b对应的经归一化处理后的时间序列化边缘曲线数据T″_va与T″_vb，先将汉简图像a和b放置到一幅新的空白图像c中，先后对汉简图像a和b的断边部分进行上对齐和下对齐，且T″_va均在左侧，T″_vb均在右侧；在上对齐和下对齐后，保持汉简图像a在图像c中固定不变，先将汉简图像b以M像素为步幅在图像c中沿竖直方向在设定的滑动范围内向上滑动，然后回到初始位置，最后沿竖直方向在设定的滑动范围内向下滑动；在汉简图像b每次滑动后，计算两幅汉简图像a和b对应的归一化处理后的时间序列化边缘曲线数据T″_va与T″_vb在竖直方向上重合部分的子曲线T″_vas与T″_vbs之间的时间序列匹配度s，并将时间序列匹配度s放入集合S中；最后，求集合S中的最大值，即为汉简图像a和b之间的最大缀合度；

K：对每幅汉简图像a，将其与待比较的文件夹中的每幅图像按照步骤J中的方法依次计算相似度；最后按照相似度值从大到小排序，若相似度相同则滑动像素值较小的优先，最后返回与汉简图像a相似度最高的前N幅图像，作为与汉简图像a缀合度较高的备选图像。

所述的步骤A中，在对汉简图像进行人工分类时，首先依据汉简内容类型和汉简图像有无纹路对汉简图像进行分组，然后在每个分组中依据汉简图像对应的汉简的缺失部位信息对汉简图像进行再次分组；汉简图像采用汉简的彩色图像。

所述的步骤B中，利用Canny算子边缘检测算法自动提取每幅汉简图像的边缘线；当首轮边缘线提取完成后，人工检查所提取到的每幅汉简图像的边缘线是否与真实情况相符，将不相符的边缘线所对应的汉简图像挑选出来作为待复检的汉简图像，然后对Canny算子边缘检测算法的参数进行调整，再次对待复检的汉简图像进行边缘提取，并人工检查所提取到的边缘线是否与真实情况相符；对于无法通过Canny算子边缘检测算法准确提取边缘线的汉简图像，由人工手动描绘其边缘线并保存；最终得到与真实情况相符的汉简图像的边缘线；最后，将每幅汉简图像对应的边缘线单独保存为背景透明、边缘线宽度为3像素、颜色为红色且图像格式为RGBA四通道的边缘线图像。

所述的步骤C中，对得到的每幅汉简图像对应的边缘线图像，依据像素阈值P将边缘线图像中的边缘线骨架增强，并将非边缘线骨架置为背景，得到每幅汉简图像所对应的边缘线骨架图像；

像素阈值P＝174，利用颜色特征将边缘线图像中像素值小于等于(174,0,0,255)的像素点置为(0,0,0,0)，否则置为(255,0,0,255)。

所述的步骤D中：

计算宽度时，首先判断边缘线骨架的最宽处的宽度值与边缘线骨架中部的宽度值之比是否大于1.2且边缘线骨架中部没有凹陷；若是，则将经过边缘线骨架竖直方向上中点的水平直线两端的边缘线骨架像素点之间的距离，作为对应的汉简图像的边缘线骨架图像的宽度；若不是，则从上到下依次求取边缘线骨架图像上每一条水平直线两端的边缘线骨架像素点之间的距离，将求得的最大距离作为对应的汉简图像的边缘线骨架图像的宽度；

计算高度时，从左到右依次求取边缘线骨架图像上每一条竖直直线两端的边缘线骨架像素点之间的距离，将求得的最大距离作为对应的汉简图像的边缘线骨架图像的高度。

所述的步骤F中，对每幅汉简图像的边缘线骨架图像进行人工观察，并确定边缘线骨架图像中边缘线骨架的断边部分的起点与终点，分别使用像素笔描绘边长为1像素的蓝色色块并保存，得到每幅汉简图像对应的标注过断边部分起点与终点的边缘线骨架标注图像。

所述的步骤G中，对步骤F中得到的边缘线骨架标注图像中边缘线骨架的断边部分的每个像素数据的像素位置进行提取，然后将依次得到的像素数据的像素位置顺序组合在一起，构成边缘线骨架的断边部分所对应的二维时间序列化数据T，T＝{(V₁,W₁),(V₂,W₂),(2₃,W₃),…,(V_i,W_i)}，i为正整数，(V_i,W_i)表示边缘线骨架的断边部分的第i个像素数据的像素位置；

在对断边部分的每个像素数据的像素位置进行提取时：

对于缺上分组中的汉简图像，从左到右依次读取断边部分每列像素数据的最上端像素点的位置坐标作为边缘线骨架在该列像素数据的像素位置；

对于缺下分组中的汉简图像，从左到右依次读取断边部分每列像素数据的最下端像素点的位置坐标作为边缘线骨架在该列像素数据的像素位置；

对于缺左的分组中的汉简图像，从上到下依次读取断边部分每行像素数据的最左端像素点的位置坐标作为边缘线骨架在该行像素数据的像素位置；

对于缺右的分组中的汉简图像，从上到下依次读取断边部分每行像素数据的最右端像素点的位置坐标作为边缘线骨架在该行像素数据的像素位置。

所述的步骤H中，在将二维时间序列化数据T转化为二维时间序列化数据T′时，将二维时间序列化数据T中的V_i做运算V_i/γ₁得到V′_i，将二维时间序列化数据T中的W_i做运算W_i/γ₂得到W′_i。

所述的步骤I中，在进行归一化处理时，首先将二维时间序列化数据T′中的V′_i和W′_i分离得到一维时间序列化数据T′_v和T′_w，T′_w＝{W′₁,W′₂,W′₃,…,W′_i}，T′_v＝{V′₁,V′₂,V′₃,…,V′_i},i为正整数；然后分别计算一维时间序列化数据T′_v和T′_w中的最小值min(T′_v)和min(T′_w)，最后将对应的一维时间序列化数据T′_v中的每个数据都分别减去min(T′_v)，将对应的一维时间序列化数据T′_w中的每个数据都分别减去min(T′_w)，得到该边缘线骨架的断边部分归一化后的时间序列化边缘曲线数据T″_v和T″_w。

所述的步骤J包括以下具体步骤：

J0：首先，依据每个汉简对应的真实物理尺寸信息得到两幅待计算相似度的汉简图像a和b对应的厚度T_ha和T_hb，计算T_ha和T_hb之间的倍数关系α₁、T_hb和T_ha之间的倍数关系α₂以及T_ha和T_hb之间的差值D；若α₁>1.5、α₂>1.5或D>0.1，则判定两幅汉简图像不能缀合，重新开始步骤J0；否则，缺上和缺下的分组进入步骤J1，缺左和缺右的分组进入步骤J9；

J1：创建一幅新的空白图像c，首先将汉简图像a放入图像c的上部，然后再把汉简图像b放入图像c的下部，且使得汉简图像b的断边部分的左端点与汉简图像a的断边部分的左端点对齐；然后进入步骤J2；

J2：汉简图像b在图像c中的当前位置下，求汉简图像b归一化处理后的时间序列化边缘曲线数据T″_wb与汉简图像a归一化处理后的时间序列化边缘曲线数据T″_wa在水平方向上重合部分的子时间序列T″_was与T″_wbs，然后进入步骤J3；

J3：将归一化处理后的时间序列化边缘曲线数据T″_wa和T″_wb的各自的首尾端点直接连线，令所形成的线段长度分别为L_a和L_b；然后，将T″_wbs的首尾端点直接连线，令所形成的线段长度为L_c；若L_c大于等于长度阈值，进入步骤J4；否则，进入步骤J5；

J4：计算子时间序列T″_was与T″_wbs之间的时间序列匹配度s，初始时时间序列匹配度s置为0；计算得到子时间序列T″_was与T″_wbs在每个对应位置的数据差值，所得到数据差值按顺序组成差值数组d，统计差值数组d中值小于等于差值阈值的元素个数，记为t_c；时间序列匹配度s＝t_c/L_c,将时间序列匹配度s的值放入集合S中，然后进入步骤J6；

J5：将子时间序列T″_was与T″_wbs之间的时间序列匹配度s置为0，并将s的值放入集合S中；然后进入步骤J6；

J6：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的左端点为参照点分别向左及向右滑动，且滑动范围不超过汉简图像a断边部分的左端点左右各8像素，每次移动后均重复步骤J2至J5，直至汉简图像b在图像c中滑动至滑动范围的边界；然后进入步骤J7；

J7：创建一幅新的空白图像c，首先将汉简图像a放入图像c的上部，然后再把汉简图像b放入图像c的下部，且使得汉简图像b的断边部分的右端点与汉简图像a的断边部分的右端点对齐，依次执行步骤J2至J5；然后进入步骤J8；

J8：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的右端点为参照点分别向左及向右滑动，且滑动范围不超过汉简图像a断边部分的右端点左右各8像素，每次移动后均重复步骤J2至J5，直至汉简图像b在图像c中滑动至滑动范围的边界；最终得到集合S；然后进入步骤K；

J9：创建一幅新的空白图像c，首先将汉简图像a放入图像c的左部，然后再把汉简图像b放入图像c的右部，且使得汉简图像b的断边部分的上端点与汉简图像a的断边部分的上端点对齐；然后进入步骤J10；

J10：汉简图像b在图像c中的当前位置下，求汉简图像b归一化处理后的时间序列化边缘曲线数据T″_vb与汉简图像a归一化处理后的时间序列化边缘曲线数据T″_va在竖直方向上重合部分的子时间序列T″_vas与T″_vbs，然后进入步骤J11；

J11：将归一化处理后的时间序列化边缘曲线数据T″_va和T″_vb的各自的首尾端点直接连线，令所形成的线段长度分别为L_a和L_b；然后，将T″_vbs的首尾端点直接连线，令所形成的线段长度为L_c；若L_c大于等于长度阈值，进入步骤J12；否则，进入步骤J13；

J12：计算子时间序列T″_vas与T″_vbs之间的时间序列匹配度s，初始时时间序列匹配度s置为0；计算得到子时间序列T″_vas与T″_vbs在每个对应位置的数据差值，所得到数据差值按顺序组成差值数组d，统计差值数组d中值小于等于差值阈值的元素个数，记为t_c；时间序列匹配度s＝t_c/L_c,将时间序列匹配度s的值放入集合S中，然后进入步骤J14；

J13：将子时间序列T″_vas与T″_vbs之间的时间序列匹配度s置为0，并将s的值放入集合S中；然后进入步骤J14；

J14：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的上端点为参照点分别向上及向下滑动，且滑动范围不超过汉简图像a断边部分的上端点上下各8像素，每次移动后均重复步骤J10至J13，直至汉简图像b在图像c中滑动至滑动范围的边界；然后进入步骤J15；

J15：创建一幅新的空白图像c，首先将汉简图像a放入图像c的左部，然后再把汉简图像b放入图像c的右部，且使得汉简图像b的断边部分的下端点与汉简图像a的断边部分的下端点对齐，依次执行步骤J10至J13；然后进入步骤J16；

J16：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的下端点为参照点分别向上及向下滑动，且滑动范围不超过汉简图像a断边部分的下端点上下各8像素，每次移动后均重复步骤J10至J13，直至汉简图像b在图像c中滑动至滑动范围的边界；最终得到集合S；然后进入步骤K。

本发明利用两块汉简的宽度、高度和厚度等物理尺寸信息，充分考虑两块汉简拼合后的上下表面的平滑性，极大地提高了汉简图像缀合的效率和准确性。

附图说明

图1为本发明的流程示意图。

具体实施方式

以下结合附图和实施例对本发明作以详细的描述：

如图1所示，本发明所述的汉简图像的自动缀合方法，依次包括以下步骤：

本发明中，汉简图像采用由汉简专业研究人员提供的汉简的彩色图像。为进一步保证缀合准确性，在对汉简图像进行人工分类时，可以首先依据汉简内容类型和汉简图像有无纹路对汉简图像进行分组，然后在每个分组中依据汉简图像对应的汉简的缺失部位信息对汉简图像进行再次分组。

B：对汉简图像进行边缘检测以提取汉简图像的边缘线，得到每幅汉简图像对应的边缘线图像。

本发明中，利用Canny算子边缘检测算法自动提取每幅汉简图像的边缘线。

当首轮边缘线提取完成后，人工检查所提取到的每幅汉简图像的边缘线是否与真实情况相符，将不相符的边缘线所对应的汉简图像挑选出来作为待复检的汉简图像，然后对Canny算子边缘检测算法的参数进行调整，对待复检的汉简图像再次进行边缘提取，并人工检查所提取到的边缘线是否与真实情况相符；对于无法通过Canny算子边缘检测算法准确提取边缘线的汉简图像，由人工手动描绘其边缘线并保存；最终得到与真实情况相符的汉简图像的边缘线；

最后，将每幅汉简图像对应的边缘线单独保存为背景透明、边缘线宽度为3像素、颜色为红色且图像格式为RGBA四通道的边缘线图像。

Canny算子边缘检测算法为本领域的常规技术，在此不再赘述。

C：利用计算机自动获取每幅汉简图像所对应的边缘线图像中的边缘线骨架，得到每幅汉简图像所对应的边缘线骨架图像，边缘线骨架指边缘线中居中的像素点。

本发明中，对得到的每幅汉简图像对应的边缘线图像，依据像素阈值P将边缘线图像中的边缘线骨架增强，并将非边缘线骨架置为背景，得到每幅汉简图像所对应的边缘线骨架图像。边缘线骨架是指步骤B中得到的宽度为3像素的边缘线中居中的像素点；

本实施例中，像素阈值P＝174，利用颜色特征，自动将像素值小于等于(174,0,0,255)的像素点置为(0,0,0,0)，否则置为(255,0,0,255)，最终得到每幅汉简图像所对应的边缘线骨架图像；括号中的四个数值分别为R、G、B和A四个通道的数值；

D：利用计算机自动测量汉简图像所对应的边缘线骨架图像的宽度及高度；

计算宽度时，首先判断边缘线骨架的最宽处的宽度值与边缘线骨架中部的宽度值之比是否大于1.2且边缘线骨架中部没有凹陷；

若是，则将经过边缘线骨架竖直方向上中点的水平直线两端的边缘线骨架像素点之间的距离，作为对应的汉简图像的边缘线骨架图像的宽度；

若不是，则从上到下依次求取边缘线骨架图像上每一条水平直线两端的边缘线骨架像素点之间的距离，将求得的最大距离作为对应的汉简图像的边缘线骨架图像的宽度。

F：人工确定每幅汉简图像的边缘线骨架图像中的断边部分，得到每幅汉简图像对应的边缘线骨架标注图像。

对每幅汉简图像的边缘线骨架图像进行人工观察，并确定边缘线骨架图像中边缘线骨架的断边部分的起点与终点，分别使用像素笔描绘边长为1像素的蓝色色块并保存，得到每幅汉简图像对应的标注过断边部分起点与终点的边缘线骨架标注图像。

G：对步骤F中得到的边缘线骨架标注图像中边缘线骨架的断边部分进行时间序列化处理，得到对应的二维数值型的时间序列化数据T。

对步骤F中得到的边缘线骨架标注图像中边缘线骨架的断边部分的每个像素数据的像素位置进行提取，然后将依次得到的像素数据的像素位置顺序组合在一起，构成边缘线骨架的断边部分所对应的二维时间序列化数据T，T＝{(V₁,W₁),(V₂,W₂),(V₃,W₃),…,(V_i,W_i)}，i为正整数，(V_i,W_i)表示边缘线骨架的断边部分的第i个像素数据的像素位置。

本发明中，在对断边部分的每个像素数据的像素位置进行提取时：

最后，将得到的断边部分的像素数据的像素位置与对应的汉简图像中的断边部分进行核对。

H：利用步骤E中得到的每幅汉简图像所对应的边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例γ₁和γ₂，将步骤G中得到的每幅汉简图像的边缘线骨架的断边部分所对应的二维时间序列化数据T，转化为每幅汉简图像的边缘线骨架的断边部分恢复到真实物理尺寸后的二维时间序列化数据T′，T′＝{(V′₁,W′₁),(V′₂,W′₂),(V′₃,W′₃),…,(V′_i,W′_i)}，i为正整数，(V′_i,W′_i)表示恢复到真实物理尺寸后的断边部分第i个像素数据的像素位置；然后将得到的恢复到真实物理尺寸后的断边部分像素数据的像素位置与对应的汉简图像中的断边部分进行核对。

在将二维时间序列化数据T转化为二维时间序列化数据T′时，将二维时间序列化数据T中的V_i做运算V_i/γ₁得到V_i′，将二维时间序列化数据T中的W_i做运算W_i/γ₂得到W_i′；

I：将步骤H中得到的二维时间序列化数据T′中的V_i′和W_i′分别进行归一化处理，得到归一化后的时间序列化边缘曲线数据T”_v和T”_w，T”_v＝{V”₁,V”₂,V”₃,…,V”_i}，T”_w＝{W”₁,W”₂,W”₃,…,W”_i}，i为正整数。

在进行归一化处理时，首先将二维时间序列化数据T′中的V_i′和W_i′分离得到一维时间序列化数据T′_v和T′_w，T′_w＝{W′₁,W′₂,W′₃,…,W′_i}，T′_v＝{V′₁,V′₂,V′₃,…,V′_i},i为正整数；然后分别计算一维时间序列化数据T′_v和T′_w中的最小值min(T′_v)和min(T′_w)，最后将对应的一维时间序列化数据T′_v中的每个数据都分别减去min(T′_v)，将对应的一维时间序列化数据T′_w中的每个数据都分别减去min(T′_w)，得到该边缘线骨架的断边部分归一化后的时间序列化边缘曲线数据T″_v和T″_w。

计算两幅汉简图像的相似度时，对于缺上和缺下的分组中拟判定是否能够缀合的两幅汉简图像a和b对应的经归一化处理后的时间序列化边缘曲线数据T″_wa与T″_wb，先将汉简图像a和b放置到一幅新的空白图像c中，先后对汉简图像a和b的断边部分进行左对齐和右对齐，且T″_wa均在上方，T″_wb均在下方；在左对齐和右对齐后，保持汉简图像a在图像c中固定不变，先将汉简图像b以M像素为步幅在图像c中沿水平方向在设定的滑动范围内向左滑动，然后回到初始位置，最后沿水平方向在设定的滑动范围内向右滑动；在汉简图像b每次滑动后，计算两幅汉简图像a和b对应的归一化处理后的时间序列化边缘曲线数据T″_wa与T″_wb在水平方向上重合部分的子曲线T″_was与T″_wbs之间的时间序列匹配度s，并将时间序列匹配度s放入集合S中；最后求集合S中的最大值，即为汉简图像a和b之间的最大缀合度。

对于缺左和缺右的分组中拟判定是否能够缀合的两幅汉简图像a和b对应的经归一化处理后的时间序列化边缘曲线数据T″_va与T″_vb，先将汉简图像a和b放置到一幅新的空白图像c中，先后对汉简图像a和b的断边部分进行上对齐和下对齐，且T″_va均在左侧，T″_vb均在右侧；在上对齐和下对齐后，保持汉简图像a在图像c中固定不变，先将汉简图像b以M像素为步幅在图像c中沿竖直方向在设定的滑动范围内向上滑动，然后回到初始位置，最后沿竖直方向在设定的滑动范围内向下滑动；在汉简图像b每次滑动后，计算两幅汉简图像a和b对应的归一化处理后的时间序列化边缘曲线数据T″_va与T″_vb在竖直方向上重合部分的子曲线T″_vas与T″_vbs之间的时间序列匹配度s，并将时间序列匹配度s放入集合S中；最后，求集合S中的最大值，即为汉简图像a和b之间的最大缀合度。

所述的步骤J中，M＝1，对于缺上和缺下的分组中，滑动范围为汉简图像a和b的断边部分在左对齐和右对齐后，从对齐点的左侧8像素至右侧8像素，对于缺左和缺右的分组中，滑动范围为汉简图像a和b的断边部分在上对齐和下对齐后，从对齐点的上端8像素至下端8像素。

所述的步骤J包括以下具体步骤：

J0：首先，依据研究汉简的学者提供每个汉简对应的真实物理尺寸信息得到两幅待计算相似度的汉简图像a和b对应的厚度T_ha和T_hb，单位为厘米，计算T_ha和T_hb之间的倍数关系α₁、T_hb和T_ha之间的倍数关系α₂以及T_ha和T_hb之间的差值D。若α₁>1.5、α₂>1.5或D>0.1，则判定两幅汉简图像不能缀合，重新开始步骤J0；否则，缺上和缺下的分组进入步骤J1，缺左和缺右的分组进入步骤J9。

J3：将归一化处理后的时间序列化边缘曲线数据T″_wa和T″_wb的各自的首尾端点直接连线，令所形成的线段长度分别为L_a和L_b，max(L_a，L_b)为两者中的较大值；然后，将T″_wbs的首尾端点直接连线，令所形成的线段长度为L_c；若L_c大于等于长度阈值，进入步骤J4；否则，进入步骤J5；长度阈值为max(L_a，L_b)值的77％；

J4：计算子时间序列T″_was与T″_wbs之间的时间序列匹配度s，初始时时间序列匹配度s置为0；计算得到子时间序列T″_was与T″_wbs在每个对应位置的数据差值，所得到数据差值按顺序组成差值数组d，统计差值数组d中值小于等于差值阈值的元素个数，记为t_c；时间序列匹配度s＝t_c/L_c,将时间序列匹配度s的值放入集合S中，然后进入步骤J6；差值阈值为2.2；

J6：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的左端点为参照点分别向左及向右滑动，且滑动范围不超过汉简图像a断边部分的左端点左右各8像素，每次移动后均重复步骤J2至J5，直至汉简图像b在图像c中滑动至滑动范围的边界，即图像b的断边部分的左端点分别与滑动范围左右两端的两个像素点重合；然后进入步骤J7。

J7：创建一幅新的空白图像c，首先将汉简图像a放入图像c的上部，然后再把汉简图像b放入图像c的下部，且使得汉简图像b的断边部分的右端点与汉简图像a的断边部分的右端点对齐，依次执行步骤J2至J5；然后进入步骤J8。

J8：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的右端点为参照点分别向左及向右滑动，且滑动范围不超过汉简图像a断边部分的右端点左右各8像素，每次移动后均重复步骤J2至J5，直至汉简图像b在图像c中滑动至滑动范围的边界，即图像b的断边部分的右端点分别与滑动范围左右两端的两个像素点重合；最终得到集合S；然后进入步骤K。

J11：将归一化处理后的时间序列化边缘曲线数据T″_va和T″_vb的各自的首尾端点直接连线，令所形成的线段长度分别为L_a和L_b，max(L_a，L_b)为两者中的较大值；然后，将T″_vbs的首尾端点直接连线，令所形成的线段长度为L_c；若L_c大于等于长度阈值，进入步骤J12；否则，进入步骤J13；长度阈值为max(L_a，L_b)值的77％；

J12：计算子时间序列T″_vas与T″_vbs之间的时间序列匹配度s，初始时时间序列匹配度s置为0；计算得到子时间序列T″_vas与T″_vbs在每个对应位置的数据差值，所得到数据差值按顺序组成差值数组d，统计差值数组d中值小于等于差值阈值的元素个数，记为t_c；时间序列匹配度s＝t_c/L_c,将时间序列匹配度s的值放入集合S中，然后进入步骤J14；差值阈值为2.2；

J14：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的上端点为参照点分别向上及向下滑动，且滑动范围不超过汉简图像a断边部分的上端点上下各8像素，每次移动后均重复步骤J10至J13，直至汉简图像b在图像c中滑动至滑动范围的边界，即图像b的断边部分的上端点分别与滑动范围上下两端的两个像素点重合；然后进入步骤J15。

J15：创建一幅新的空白图像c，首先将汉简图像a放入图像c的左部，然后再把汉简图像b放入图像c的右部，且使得汉简图像b的断边部分的下端点与汉简图像a的断边部分的下端点对齐，依次执行步骤J10至J13；然后进入步骤J16。

J16：以1像素为步幅，将汉简图像b在汉简图像c中以汉简图像a断边部分的下端点为参照点分别向上及向下滑动，且滑动范围不超过汉简图像a断边部分的下端点上下各8像素，每次移动后均重复步骤J10至J13，直至汉简图像b在图像c中滑动至滑动范围的边界，即图像b的断边部分的下端点分别与滑动范围上下两端的两个像素点重合；最终得到集合S；然后进入步骤K。

K：对每幅汉简图像a，将其与待比较的文件夹中的每幅图像按照步骤J中的方法依次计算相似度。最后按照相似度值从大到小排序，若相似度相同则滑动像素值较小的优先，最后返回与汉简图像a相似度最高的前N幅图像，作为与汉简图像a缀合度较高的备选图像。

本实施例中，N＝5。

Claims

1.一种汉简图像的自动缀合方法，其特征在于，包括以下步骤：

D：测量汉简图像所对应的边缘线骨架图像的宽度及高度；

T＝{(V₁，W₁)，(V₂，W₂)，(V₃，W₃)，…，(V_i，W_i)}，i为正整数，(V_i，W_i)表示边缘线骨架的断边部分的第i个像素数据的像素位置；

H：利用步骤E中得到的每幅汉简图像所对应的边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例γ₁和γ₂，将步骤G中得到的每幅汉简图像的边缘线骨架的断边部分所对应的二维时间序列化数据T，转化为每幅汉简图像的边缘线骨架的断边部分恢复到真实物理尺寸后的二维时间序列化数据T′，T′＝{(V′₁，W′₁)，(V′₂，W′₂)，(V′₃，W′₃)，…，(V′_i，W′_i)}，i为正整数，(V′_i，W′_i)表示恢复到真实物理尺寸后的断边部分第i个像素数据的像素位置；

I：将步骤H中得到的二维时间序列化数据T′中的V′_i和W′_i分别进行归一化处理，得到归一化后的时间序列化边缘曲线数据T″_v和T″_w，T″_v＝{V″₁，V″₂，V”₃，…，V″_i}，T″_w＝{W″₁，W″₂，W″₃，…，W″_i}，i为正整数；

计算两幅汉简图像的相似度时，对于缺上和缺下的分组中拟判定是否能够缀合的两幅汉简图像a和b对应的经归一化处理后的时间序列化边缘曲线数据T″_wa与T″_wb，先将汉简图像a和b放置到一幅新的空白图像c中，先后对汉简图像a和b的断边部分进行左对齐和右对齐，且T″_wa均在上方，T″_wb均在下方；在左对齐和右对齐后，保持汉简图像a在图像c中固定不变，先将汉简图像b以M像素为步幅在图像c中沿水平方向在设定的滑动范围内向左滑动，然后回到初始位置，最后沿水平方向在设定的滑动范围内向右滑动；在汉简图像b每次滑动后，计算两幅汉简图像a和b对应的归一化处理后的时间序列化边缘曲线数据T″_wa与T″_wb在水平方向上重合部分的子曲线T″_was与T″_wbs之间的时间序列匹配度s，并将时间序列匹配度s放入集合S中；最后求集合S中的最大值，即为汉简图像a和b之间的最大缀合度；

2.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤A中，在对汉简图像进行人工分类时，首先依据汉简内容类型和汉简图像有无纹路对汉简图像进行分组，然后在每个分组中依据汉简图像对应的汉简的缺失部位信息对汉简图像进行再次分组；汉简图像采用汉简的彩色图像。

3.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤B中，利用Canny算子边缘检测算法自动提取每幅汉简图像的边缘线；当首轮边缘线提取完成后，人工检查所提取到的每幅汉简图像的边缘线是否与真实情况相符，将不相符的边缘线所对应的汉简图像挑选出来作为待复检的汉简图像，然后对Canny算子边缘检测算法的参数进行调整，对待复检的汉简图像再次进行边缘提取，并人工检查所提取到的边缘线是否与真实情况相符；对于无法通过Canny算子边缘检测算法准确提取边缘线的汉简图像，由人工手动描绘其边缘线并保存；最终得到与真实情况相符的汉简图像的边缘线；最后，将每幅汉简图像对应的边缘线单独保存为背景透明、边缘线宽度为3像素、颜色为红色且图像格式为RGBA四通道的边缘线图像。

4.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤C中，对得到的每幅汉简图像对应的边缘线图像，依据像素阈值P将边缘线图像中的边缘线骨架增强，并将非边缘线骨架置为背景，得到每幅汉简图像所对应的边缘线骨架图像；

像素阈值P＝174，利用颜色特征将边缘线图像中像素值小于等于(174，0，0，255)的像素点置为(0，0，0，0)，否则置为(255，0，0，255)。

5.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤D中：

6.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤F中，对每幅汉简图像的边缘线骨架图像进行人工观察，并确定边缘线骨架图像中边缘线骨架的断边部分的起点与终点，分别使用像素笔描绘边长为1像素的蓝色色块并保存，得到每幅汉简图像对应的标注过断边部分起点与终点的边缘线骨架标注图像。

7.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤G中，对步骤F中得到的边缘线骨架标注图像中边缘线骨架的断边部分的每个像素数据的像素位置进行提取，然后将依次得到的像素数据的像素位置顺序组合在一起，构成边缘线骨架的断边部分所对应的二维时间序列化数据T，T＝{(V₁，W₁)，(V₂，W₂)，(V₃，W₃)，…，(V_i，W_i)}，i为正整数，(V_i，W_i)表示边缘线骨架的断边部分的第i个像素数据的像素位置；

在对断边部分的每个像素数据的像素位置进行提取时：

8.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤H中，在将二维时间序列化数据T转化为二维时间序列化数据T′时，将二维时间序列化数据T中的V_i做运算V_i/γ₁得到V′_i，将二维时间序列化数据T中的W_i做运算W_i/γ₂得到W′_i。

9.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤I中，在进行归一化处理时，首先将二维时间序列化数据T′中的V′_i和W′_i分离得到一维时间序列化数据T′_v和T′_w，T′_w＝{W′₁，W′₂，W′₃，…，W′_i}，T′_v＝{V′₁，V′₂，V′₃，…，V′_i}，i为正整数；然后分别计算一维时间序列化数据T′_v和T′_w中的最小值min(T′_v)和min(T′_w)，最后将对应的一维时间序列化数据T′_v中的每个数据都分别减去min(T′_v)，将对应的一维时间序列化数据T′_w中的每个数据都分别减去min(T′_w)，得到该边缘线骨架的断边部分归一化后的时间序列化边缘曲线数据T″_v和T″_w。

10.根据权利要求1所述的汉简图像的自动缀合方法，其特征在于：所述的步骤J包括以下具体步骤：

J0：首先，依据每个汉简对应的真实物理尺寸信息得到两幅待计算相似度的汉简图像a和b对应的厚度T_ha和T_hb，计算T_ha和T_hb之间的倍数关系α₁、T_hb和T_ha之间的倍数关系α₂以及T_ha和T_hb之间的差值D；若α₁＞1.5或α₂＞1.5或D＞0.1，则判定两幅汉简图像不能缀合，重新开始步骤J0；否则，缺上和缺下的分组进入步骤J1，缺左和缺右的分组进入步骤J9；

J4：计算子时间序列T″_was与T″_wbs之间的时间序列匹配度s，初始时时间序列匹配度s置为0；计算得到子时间序列T″_was与T″_wbs在每个对应位置的数据差值，所得到数据差值按顺序组成差值数组d，统计差值数组d中值小于等于差值阈值的元素个数，记为t_c；时间序列匹配度s＝t_c/L_c，将时间序列匹配度s的值放入集合S中，然后进入步骤J6；

J12：计算子时间序列T″_vas与T″_vbs之间的时间序列匹配度s，初始时时间序列匹配度s置为0；计算得到子时间序列T″_vas与T″_vbs在每个对应位置的数据差值，所得到数据差值按顺序组成差值数组d，统计差值数组d中值小于等于差值阈值的元素个数，记为t_c；时间序列匹配度s＝t_c/L_c，将时间序列匹配度s的值放入集合S中，然后进入步骤J14；