CN111310760B

CN111310760B - 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法

Info

Publication number: CN111310760B
Application number: CN202010094934.1A
Authority: CN
Inventors: 宋传鸣; 何熠辉; 洪飏; 王相海
Original assignee: Liaoning Normal University
Current assignee: Liaoning Normal University
Priority date: 2020-02-13
Filing date: 2020-02-13
Publication date: 2023-05-26
Anticipated expiration: 2040-02-13
Also published as: CN111310760A

Abstract

本发明公开一种结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法，属于数字图像处理和古文字信息处理的交叉领域。首先，输入待处理的甲骨刻辞图像I，将其颜色空间从RGB转换到HSV，采用最大类间方差法对其V分量进行二值化，并利用多条件连通区域填充算法得到图像I的粗去噪结果；其次，通过含有6组卷积层的特征提取子网络分析图像I的深度卷积特征；然后，利用含有3组卷积层的区域建议子网络选取感兴趣区域，并计算各个感兴趣区域的评分；最后，利用特征降维子网络和区域分类子网络确定甲骨文字的区域，并经过非极大值抑制算法去除重叠的候选框，生成带有框选结果的结果图像。

Description

结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法

技术领域

本发明涉及数字图像处理和古文字信息处理的交叉领域，尤其是一种可有效抵抗龟甲和兽骨上的点状噪声、片状斑纹和固有纹理的干扰，准确性高、鲁棒性好、处理速度快、具备自适应能力的结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法。

背景技术

甲骨文是商朝后期用龟甲、兽骨进行记事和占卜的文字。它作为我国迄今为止发现的年代最早的成熟文字系统，具有极其重要的保护价值、研究价值以及崇高的象征意义。甲骨文不仅是我国语言、文化、历史可追溯的最早源头，是汉字的源头和中华优秀传统文化的根脉，是千年中华文明的标志，也印证了历史上一系列古文献的真实性，把有记载的中华文明史向前推进了近五个世纪。因此，自甲骨被发现之日起，我国学者就开始对其进行搜集、鉴定和研究，这促使甲骨文字考释成为古文字研究领域中最重要的内容之一。

因为甲骨文字数量众多，年代久远，其结构不仅明显有别于现代文字，而且形体复杂、字形繁复、异体字众多，所以释读甲骨文要求研究者具有广博的知识基础和长期的专业训练，是一项极具挑战的任务，目前仍存大量甲骨文字未被准确释读，甚至有学者将其归之为“绝学”以内。随着计算机图像识别能力的提升，以计算机视觉技术为基础，结合甲骨文的专业知识，进行甲骨文字识别已成为可能。在这种情况下，在龟甲或兽骨上自动定位到甲骨文字区域，对于保证后续的文字分割和字形复原质量、提高字形特征提取和自动识别精度具有基础且重要的意义。然而，一方面，经过三千余年的土壤压力和腐蚀，又经发掘、运输、辗转流传，很多甲骨均有不同程度的损坏，其文字多已模糊不清，而且龟甲和兽骨的质地亦不光滑，本身又存在齿缝、兆纹、盾纹、刻痕等纹理；另一方面，甲骨文的文例有独特的规律，“沿中缝而刻辞向外，在右右行，在左左行，沿首尾之两边而刻辞者，向内，在右左行，在左右行”。这意味着甲骨文字的分布与边缘的方向存在一定关系，且行不明显，导致甲骨文字往往被大量的固有边缘和纹理所干扰，欲想利用典型的文档分析算法进行处理几乎是不可能的。因此，将甲骨文字从干扰严重的背景中自动地准确检测定位出来，变得异常困难。

针对现代汉字的区域检测，方承志等人提出了一种基于联合边界框校准的自然场景文本检测方法。首先，原始图像经过缩放处理后，输入特征提取层，得到不同尺度和抽象层级的特征图，然后通过特征融合层使得深层语义特征与浅层纹理特征相融合，采用3个相互独立的子网分别对置信度边界框坐标偏移量和旋转角度偏移量进行计算，构建出预测层，进而对最终筛选出的文本对象进行边界框校准，获得最终检测结果。李晓玉等人提出了一种结合感受野增强和全卷积网络的场景文字检测方法，利用全卷积网络构建的特征金字塔网络产生多通道的像素级别的文本得分图和旋转矩形框预测图，再经精细局部感知非极大值抑制，产生最终的结果。但上述两种方法尚存在对于长文本和特大文字检测不全甚至漏检测的现象。唐有宝等人提出了一种基于多层次最大稳定极值区域(Maximally StableExtremal Regions,MSER)的自然场景文本检测方法，输入图像经平滑处理后，进行多层次最大稳定极值候选区域提取，并对候选区域进行特征提取和评分，然后利用自适应阈值实现候选区域的分类，得到最终的文本检测结果。白翔等人提出了一种基于深度卷积神经网络的、端到端的自然场景文字检测方法，通过预测文字框选区域的置信度及其与默认框选区域的坐标偏置，在多个特征层输出目标对应区域的坐标信息。同时，针对文本区域一般呈长方形的特点，一方面，该方法采用长矩形的卷积核来取代传统的正方形卷积核，并调整默认框选区域的长宽比，使其更接近真实的文本区域形态，从而有助于加快神经网络的收敛速度；另一方面，对得到的所有框选区域进行非最大值抑制，滤去重叠度比较高的候选框，降低了文本区域的误检率。然而，由于现代汉字与甲骨文字的特征之间存在显著差异，并且现代汉字的背景干扰较弱，上述方法不适用甲骨刻辞文字的自动区域检测，无法在复杂的背景中定位到甲骨文字。

针对甲骨文字的区域检测，史小松等人提出了一种基于阈值分割和形态学的甲骨文字定位方法，首先对原始拓片图像进行增强，然后采用最大类间方差法实现阈值化，形成候选文字区，再利用数学形态学的连通分量标注及其连通面积统计进行处理，进而确定甲骨文字区域。黄勇杰等人提出了一种基于稀疏活动轮廓模型的甲骨拓片图像的目标自动定位算法，首先以目标形状估计作为约束，仅对图像中部分点的位置进行回归，再通过共同勾画算法学习到目标轮廓模型，在待定位图中扫描出与模型匹配度最高的区域，进而利用基于距离约束的Hough变换来降低噪声影响、减少定位时间。然而，上述两种方法仅能在甲骨拓片图像中定位到拓片的位置，却无法实现甲骨文字的准确提取。

综上所述，目前尚没有一种可有效抵抗龟甲和兽骨上存在的点状噪声、片状斑纹和固有纹理干扰的，准确性高、鲁棒性好、处理速度快、具备自适应能力的甲骨文字自动检测方法。

发明内容

本发明是为了解决现有技术所存在的上述技术问题，提供一种准确性高、鲁棒性好、处理速度快、具备自适应能力的结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法。

本发明的技术解决方案是：一种结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法，其特征在于按照如下步骤进行：

步骤1.建立并初始化用于甲骨刻辞文字检测的深度卷积神经网络N_obc，所述N_obc包含1个用于特征提取的子网络N_feature、1个用于甲骨文字区域建议的子网络N_rpn、1个用于甲骨文字区域特征降维的子网络N_dim和1个用于区域分类的子网络N_cls；

步骤1.1建立并初始化子网络N_feature，含有6组卷积层，分别为Conv0、Conv1、Conv2、Conv3、Conv4和Conv5；

所述Conv0包含1层卷积操作和5个由公式(1)定义的预设卷积核，每个卷积核以1个像素为步长进行卷积运算；

所述Conv1包含2层卷积操作和1层池化操作，其中，每个卷积层含有64个大小为3×3的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长进行卷积运算，池化层以大小为2×2的池化核、以SAME填充模式进行最大池化运算；

所述Conv2包含2层卷积操作和1层池化操作，其中，每个卷积层含有128个大小为3×3的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长进行卷积运算，池化层以大小为2×2的池化核、以SAME填充模式进行最大池化运算；

所述Conv3包含3层卷积操作和1层池化操作，其中，每个卷积层含有256个大小为3×3的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长进行卷积运算，池化层以大小为2×2的池化核、以SAME填充模式进行最大池化运算；

所述Conv4包含3层卷积操作和1层池化操作，其中，每个卷积层含有512个大小为3×3的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长进行卷积运算，池化层以大小为2×2的池化核、以SAME填充模式进行最大池化运算；

所述Conv5包含3层卷积操作，其中，每个卷积层含有512个大小为3×3的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长进行卷积运算；

步骤1.2建立并初始化子网络N_rpn，含有3组卷积层，分别为RpnConv、RpnPred和RpnScore；

所述RpnConv包含1层卷积操作，含有512个大小为3×3的卷积核，每个卷积核以1个像素为步长、以SAME填充模式进行卷积运算，并采用均值为0、标准差为0.01的高斯分布进行初始化；

所述RpnPred包含1层卷积操作，含有36个大小为1×1的卷积核，每个卷积核以1个像素为步长、以VALID填充模式进行卷积运算，并采用均值为0、标准差为0.01的高斯分布进行初始化；

所述RpnScore包含1层卷积操作，含有18个大小为1×1的卷积核，每个卷积核以1个像素为步长、以VALID填充模式进行卷积运算，并采用均值为0、标准差为0.01的高斯分布进行初始化；

步骤1.3建立并初始化子网络N_dim，含有1组剪裁池化层和2组卷积层，分别为CropPool、Conv6和Conv7；

所述CropPool包含1层缩放操作和1层池化操作，其中，缩放操作用于将候选区域的尺寸变换为14×14像素，池化层以大小为2×2的池化核、以SAME填充模式进行最大池化运算；

所述Conv6包含3层卷积操作，其中，每个卷积层含有512个大小为3×3的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长、以VALID填充模式进行卷积运算；

所述Conv7包含1层卷积操作，含有4096个大小为1×1的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长、以VALID填充模式进行卷积运算；

步骤1.4建立并初始化子网络N_cls，含有2组全连接层，分别为Fc1和Fc2；

所述Fc1有4096个输入单元和8个输出单元，并采用均值为0、标准差为0.001的高斯分布进行初始化；

所述Fc2有4096个输入单元和2个输出单元，并采用均值为0、标准差为0.01的高斯分布进行初始化；

步骤2.输入甲骨刻辞图像训练集和人工已标注的每幅训练图像的甲骨文字区域坐标集、甲骨文字区域标签集，对深度卷积神经网络N_obc进行训练；

步骤2.1对于训练集中的每幅图像T及其人工已标注的甲骨文字区域坐标集C_ref和甲骨文字区域标签集C_label，令迭代次数iter←1，执行步骤2.2～2.11；

步骤2.2将每幅图像T的颜色空间从RGB转换到HSV，并将其V分量记为T_V；

步骤2.3采用最大类间方差法计算T_V的最优全局阈值，并将T_V进行二值化，而保持每幅图像T的饱和度分量T_S和色调分量T_H不变；

步骤2.4将二值化后的T_V分量与饱和度分量T_S、色调分量T_H从HSV颜色空间转换到RGB空间，令所得图像为T′；

步骤2.5采用子网络N_feature提取图像T′的特征图；

步骤2.5.1利用卷积层Conv0的5个卷积核对图像T′进行卷积运算，令各个卷积核的计算结果分别为C₁、C₂、C₃、C₄、C₅，再根据公式(2)将5个卷积结果进行融合，提取出图像T′的局部先验纹理特征图TF₁；

C＝C₁×w₁+C₂×w₂+C₃×w₃+C₄×w₄+C₅×w₅ (2)

所述w₁和w₂表示预设权重；

步骤2.5.2利用卷积层Conv1对局部先验纹理特征图TF₁进行卷积运算，得到卷积特征图TF₂；

步骤2.5.3利用卷积层Conv2对卷积特征图TF₂进行卷积运算，得到更大尺度下的卷积特征图TF₃；

步骤2.5.4利用卷积层Conv3对卷积特征图TF₃进行卷积运算，得到更大尺度下的卷积特征图TF₄；

步骤2.5.5利用卷积层Conv4对卷积特征图TF₄进行卷积运算，得到更大尺度下的卷积特征图TF₅；

步骤2.5.6利用卷积层Conv5对卷积特征图TF₅进行卷积运算，得到更大尺度下的卷积特征图TF₆；

步骤2.6采用子网络N_rpn选取图像T′的候选甲骨文字区域；

步骤2.6.1利用卷积层RpnConv对卷积特征图TF₆进行卷积运算，得到初始区域建议结果TR_init；

步骤2.6.2利用卷积层RpnPred对初始区域建议结果TR_init进行处理，得到区域建议的预测集合TR_pred；

步骤2.6.3利用卷积层RpnScore对区域建议的预测集合TR_init进行处理，然后经过softmax激活函数，计算得到区域建议的可能性评估结果集合TR_score；

步骤2.6.4根据区域建议的预测集合TR_pred和区域建议的可能性评估结果集合TR_score，利用非极大值抑制方法获得图像T′的候选区域集合TR_ROIs；

步骤2.7对于图像T′的候选区域集合TR_ROIs的每个候选甲骨文字区域TR_ROI，采用子网络N_dim提取该区域的卷积特征图；

步骤2.7.1将每个候选甲骨文字区域TR_ROI作为掩码，提取出卷积特征图TF₆中处于该区域的卷积特征子图TF′₆；

步骤2.7.2采用剪裁池化层CropPool将卷积特征子图TF′₆缩放变换为14×14像素，得到尺寸归一化后的卷积特征子图TF″₆；

步骤2.7.3利用卷积层Conv6对卷积特征子图TF″₆进行卷积运算，得到更大尺度下的卷积特征图TF′₇；

步骤2.7.4利用卷积层Conv7对卷积特征图TF′₇进行卷积运算，得到更大尺度下的卷积特征图TF′₈；

步骤2.7.5按照光栅扫描的顺序，将卷积特征图TF′₈拉伸成长度为4096的一维向量TF′_1d；

步骤2.8对于图像T′的候选区域集合TR_ROIs的每个候选甲骨文字区域TR_ROI，根据TR_ROI所对应的一维向量TF′_1d，采用子网络N_cls对其进行分类，计算得出其候选区域的顶点坐标集合、分类置信度向量和分类预测结果；

步骤2.8.1利用全连接层Fc1对一维向量TF′_1d进行处理，得到候选甲骨文字区域TR_ROI的顶点坐标集合TB′_pred；

步骤2.8.2利用全连接层Fc2对一维向量TF′_1d进行处理，得到候选甲骨文字区域TR_ROI的分类置信度向量TS_cls，再经过softmax激活函数，得出最终的分类预测结果TS′_pred；

步骤2.9将图像T′的每个候选文字区域的顶点坐标集合TB′_pred取并集，得到图像T′的所有候选文字区域的集合TB_pred；

步骤2.10分别计算分类置信度向量TS_cls与人工标注的甲骨文字区域标签集C_label的交叉熵损失Loss₁、所有候选文字区域的集合TB_pred与人工标注的甲骨文字区域集合C_ref的重叠度损失Loss₂、区域建议的可能性评估结果集合TR_score与人工标注的甲骨文字区域标签集C_label的交叉熵损失Loss₃、区域建议的预测集合TR_pred与人工标注的甲骨文字区域集合C_ref的重叠度损失Loss₄，根据公式(3)～公式(5)计算甲骨文字区域的预测损失TotalLoss；

TotalLoss＝Loss+RLoss (5)

所述||·||₁表示L₁-范数；

步骤2.11若训练集中的所有图像均已处理完毕，则转入步骤2.12，否则从训练集中取出一幅未处理的图像，令其为T，返回步骤2.2；

步骤2.12令iter←iter+1，若迭代次数iter＞Total_iter，则得到已训练好的深度卷积神经网络N_obc，转入步骤3，否则利用基于随机梯度下降法的反向误差传播算法和预测损失TotalLoss更新N_obc的参数，转入步骤2.2重新处理训练集中的所有图像，所述Total_iter表示预设的迭代次数；

步骤3.输入待处理的甲骨刻辞图像I，其颜色空间为RGB，采用已完成训练的深度卷积神经网络N_obc检测I中的甲骨文字区域；

步骤3.1将I的颜色空间从RGB转换到HSV，并将其V分量记为I_V；

步骤3.2采用最大类间方差法计算I_V的最优全局阈值，并将I_V进行二值化，保持I的饱和度分量I_S和色调分量I_H不变；

步骤3.3利用多条件连通区域填充算法对I_V进行处理，得到图像I的粗去噪结果；

步骤3.3.1采用尺寸为10×10像素的矩形结构元素，对I_V施加形态学开运算，并标记出全部的8-连通区域，令8-连通区域的总数为N_c；

步骤3.3.2采用OpenCV的contourArea方法，计算第i(1≤i≤N_c)个8-连通区域的面积与图像总面积的比值S_i；

步骤3.3.3采用OpenCV的convexHull方法，计算第i个8-连通区域的凸包，进而利用contourArea方法计算第i个8-连通区域的轮廓面积与其凸包面积的比值K_i；

步骤3.3.4采用OpenCV的approxPolyDP多边拟合方法，计算第i个8-连通区域的多边形逼近角点数N_i；

步骤3.3.5对于第i个8-连通区域，若其满足K_i＜0.4，或S_i＜0.001，或0.002＜S_i＜0.014，或N_i＞12且S_i＜0.05，则将该8-连通区域用黑色像素进行填充；

步骤3.3.6将处理后的I_V分量与饱和度分量I_S、色调分量I_H从HSV颜色空间转换到RGB空间，令所得图像为I′；

步骤3.4采用子网络N_feature提取图像I′的特征图；

步骤3.4.1利用卷积层Conv0的5个卷积核对图像I′进行卷积运算，令各个卷积核的计算结果分别为C₁、C₂、C₃、C₄、C₅，再根据公式(2)的定义将5个卷积结果进行融合，从而提取出I′的局部先验纹理特征图F₁；

步骤3.4.2利用卷积层Conv1对局部先验纹理特征图F₁进行卷积运算，得到卷积特征图F₂；

步骤3.4.3利用卷积层Conv2对卷积特征图F₂进行卷积运算，得到更大尺度下的卷积特征图F₃；

步骤3.4.4利用卷积层Conv3对卷积特征图F₃进行卷积运算，得到更大尺度下的卷积特征图F₄；

步骤3.4.5利用卷积层Conv4对卷积特征图F₄进行卷积运算，得到更大尺度下的卷积特征图F₅；

步骤3.4.6利用卷积层Conv5对卷积特征图F₅进行卷积运算，得到更大尺度下的卷积特征图F₆；

步骤3.5采用子网络N_rpn选取图像I′的候选甲骨文字区域；

步骤3.5.1利用卷积层RpnConv对卷积特征图F₆进行卷积运算，得到初始区域建议结果R_init；

步骤3.5.2利用卷积层RpnPred对初始区域建议结果R_init进行处理，得到区域建议的预测集合R_pred；

步骤3.5.3利用卷积层RpnScore对初始区域建议结果R_init进行处理，然后经过softmax激活函数，计算得到区域建议的可能性评估结果集合R_score；

步骤3.5.4根据区域建议的预测集合R_pred和区域建议的可能性评估结果集合R_score，利用非极大值抑制方法获得甲骨文字的候选区域集合R_ROIs，并相应地更新可能性评估结果集合R_score；

步骤3.6对于甲骨文字的候选区域集合R_ROIs的每个候选甲骨文字区域R_ROI，采用子网络N_dim提取该区域的卷积特征图；

步骤3.6.1将每个候选甲骨文字区域R_ROI作为掩码，提取出卷积特征图F₆中处于该区域的卷积特征子图F′₆；

步骤3.6.2采用剪裁池化层CropPool将卷积特征子图F′₆缩放变换为14×14像素，得到尺寸归一化后的卷积特征子图F″₆；

步骤3.6.3利用卷积层Conv6对卷积特征子图F″₆进行卷积运算，得到更大尺度下的卷积特征图F′₇；

步骤3.6.4利用卷积层Conv7对卷积特征图F′₇进行卷积运算，得到更大尺度下的卷积特征图F′₈；

步骤3.6.5按照光栅扫描的顺序，将卷积特征图F′₈拉伸成长度为4096的一维向量F′_1d；

步骤3.7对于甲骨文字的候选区域集合R_ROIs的每个候选甲骨文字区域R_ROI，根据R_ROI所对应的一维向量F′_1d，采用子网络N_cls对其进行分类，计算得到其候选框的顶点坐标集合、分类置信度向量和分类预测结果；

步骤3.7.1利用全连接层Fc1对一维向量F′_1d进行处理，得到候选区域的顶点坐标集合B′_pred；

步骤3.7.2利用全连接层Fc2对一维向量F′_1d进行处理，得到候选甲骨文字区域R_ROI的分类置信度向量S_cls，再经过softmax激活函数，得出最终的分类预测结果S′_pred；

步骤3.7.3若分类预测结果S′_pred为“甲骨文字区域”，则保留R_ROI，否则从R_ROIs中将R_ROI删除，从R_score中删除R_ROI所对应的评分，并删除顶点坐标集合B′_pred；

步骤3.8根据甲骨文字的候选区域集合R_ROIs中每个候选文字区域R_ROI的顶点坐标及其评分结果，利用非极大值抑制算法去除重叠的候选框，进而获得最终的甲骨文字区域的顶点坐标集合B_final，并更新可能性评估结果集合R_score；

步骤3.9根据顶点坐标集合B_final和可能性评估结果集合R_score，在待处理图像I上绘制矩形候选框及其置信度，并输出带有框选标记的结果图像。

本发明与现有技术相比，具有如下优点：第一，利用特定卷积核和数学形态学等手段，对文字边缘方向、轮廓面积与凸包面积比、连通区域面积、多边形逼近角点数等局部先验特征进行提取，并采用深度卷积神经网络对甲骨文字的字形特征进行自主学习，从而将局部先验特征和全局深度卷积特征进行有效融合和相互补充、增强，充分发掘了甲骨刻辞文字的连通区域特征和形状特征，可在一定程度上抵抗点状噪声、片状斑纹以及龟甲、兽骨固有纹理的干扰，较为准确地检测出甲骨文字；第二，无需人工交互，可以批量自动处理甲骨文字图像，不仅在时间效率上明显优于人工检测方法和基于联合边界框校准的自然场景文本检测等传统的目标检测方法，而且平均检测精度也高于传统的目标检测方法。本发明平均查全率达到88.9％，平均查准率达到了80.23％，具有准确性高、鲁棒性好、处理速度快、自适应能力强等优点。

附图说明

图1是本发明对不同甲骨拓片图像的文字检测结果图。

具体实施方式

本发明的结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法，按照如下步骤进行；

所述Conv1包含2层卷积操作和1层池化操作，其中，每个卷积层含有64个大小为3×3的、以Xavier方法进行初始化的卷积核，每个卷积核以1个像素为步长进行卷积运算，池化层以大小为2×2的池化核、以SAME填充模式进行最大池化(Max Pooling)运算；

步骤2.5采用子网络N_feature提取图像T′的特征图；

C＝C₁×w₁+C₂×w₂+C₃×w₃+C₄×w₄+C₅×w₅ (2)

所述w₁和w₂表示预设权重；

步骤2.6采用子网络N_rpn选取图像T′的候选甲骨文字区域；

步骤2.6.4根据区域建议的预测集合TR_pred和区域建议的可能性评估结果集合TR_score，利用非极大值抑制(Non-Maximum Suppression，NMS)方法获得图像T′的候选区域集合TR_ROIs；

步骤2.7.1将每个候选甲骨文字区域TR_ROI作为掩码(mask)，提取出卷积特征图TF₆中处于该区域的卷积特征子图TF′₆；

步骤2.10分别计算分类置信度向量TS_cls与人工标注的甲骨文字区域标签集C_label的交叉熵损失Loss₁、所有候选文字区域的集合TB_pred与人工标注的甲骨文字区域集合C_ref的重叠度(Intersection over Union，IoU)损失Loss₂、区域建议的可能性评估结果集合TR_score与人工标注的甲骨文字区域标签集C_label的交叉熵损失Loss₃、区域建议的预测集合TR_pred与人工标注的甲骨文字区域集合C_ref的重叠度损失Loss₄，根据公式(3)～公式(5)计算甲骨文字区域的预测损失TotalLoss；

TotalLoss＝Loss+RLoss (5)

所述||·||₁表示L₁-范数；

步骤3.1将I的颜色空间从RGB转换到HSV，并将其V分量记为I_V；

步骤3.4采用子网络N_feature提取图像I′的特征图；

步骤3.5采用子网络N_rpn选取图像I′的候选甲骨文字区域；

步骤3.5.4根据区域建议的预测集合R_pred和区域建议的可能性评估结果集合R_score，利用非极大值抑制(Non-Maximum Suppression，NMS)方法获得甲骨文字的候选区域集合R_ROIs，并相应地更新可能性评估结果集合R_score；

从《甲骨文合集》中选取1000幅甲骨拓片图像，分别采用CTPN(ConnectionistText Proposal Network)方法、EAST(Efficient and Accurate Scene Text Detector)方法和本发明进行甲骨文字检测得到的平均查全率和查准率结果如表1，本发明实施例对不同甲骨拓片图像的文字检测结果如图1中a～i所示。

从表1可见，由于CTPN方法和EAST方法受到龟甲和兽骨上的点状噪声、片状斑纹和固有纹理的干扰，并且没有充分发掘甲骨文字的本质特征，其查全率和查准率均很低，而本发明则通过将先验特征与深度卷积特征相结合，有效区分甲骨刻辞文字和甲骨固有纹理、噪声，从而提高了检测算法对点状噪声、片状斑纹和固有纹理的鲁棒性，能够准确地检测出拓片图像中的文字区域，有利于提高后续的甲骨文字自动分割和识别的精度。

表1甲骨刻辞文字自动检测的结果统计表

/>