CN112232348B

CN112232348B - 一种基于机器视觉的甲骨文识别方法及系统

Info

Publication number: CN112232348B
Application number: CN202010931079.5A
Authority: CN
Inventors: 张殿典; 张永康
Original assignee: South China Normal University
Current assignee: South China Normal University
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2021-10-01
Anticipated expiration: 2040-09-07
Also published as: CN112232348A

Abstract

本发明公开了一种基于机器视觉的甲骨文识别方法及系统，通过将拓片图像灰度化得到拓片灰度图；通过提取拓片灰度图的边缘点；对各个边缘点进行高斯滤波，计算得到各个边缘点处的梯度方向，分别按各个边缘点处正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距；筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点；提取出文字边缘点构成的连通区域作为文字区域。对于因甲骨文出土的历史原因导致甲骨划痕、风化、裂纹、坑洞等原因，能够较高准确率的对文字区域进行增强，保证了甲骨文文字区域的完整性和甲骨文提取可靠性，降低了甲骨文拓片的误检识别概率。

Description

一种基于机器视觉的甲骨文识别方法及系统

技术领域

本发明涉及古文字识别技术领域，具体涉及一种基于机器视觉的甲骨文识别方法及系统。

背景技术

目前，甲骨文之类的古文字一般而言都还没有进入国标或者国际标准，大部分的甲骨文字在进行甲骨文考释的过程中，检索相应甲骨文字则需要大量的已标注的甲骨图像作为数据支撑，而且由于各种拓片只有甲骨文专家才能够人工标注耗时耗力，自甲骨文首次发现以来，据统计大部分出土的甲骨上刻有的单字约4500个，迄今已释读出的字仅约有2000个左右，因此甲骨中未释出的单词依旧占大多数，并且由于各地陆续出土的甲骨有各种变体，即很多时候同一个字由不同的专家辨识，难以识别出该字变体，出现很多识错辩错等情况。并且由于甲骨文出土的历史原因导致甲骨划痕、风化、裂纹、坑洞等原因，导致现有的这些识别甲骨文方法对甲骨文图像误检错误率的大幅增加，如何能从这种变形的甲骨文拓片图像中提取出甲骨文字并准确识别，一直是当前甲骨文字识别研究的热点问题。

发明内容

本发明的目的在于提出一种基于机器视觉的甲骨文识别方法及系统，以解决现有技术中所存在的一个或多个技术问题，至少提供一种有益的选择或创造条件。

由于一般拓片上常常由于甲骨划痕、风化、裂纹、坑洞等原因导致识别不准确的问题，所以在识别之前需要进行拓片图像的增强化，增强化之后方可进行进一步识别。

为了实现上述目的，根据本发明的一方面，提供一种基于机器视觉的甲骨文识别方法，所述方法包括以下步骤：

S100，利用线阵相机扫描甲骨文拓片得到拓片图像；

S200，将拓片图像灰度化得到拓片灰度图；

S300，通过Canny算子或Prewitt算子提取拓片灰度图的边缘点；

S300，对各个边缘点进行高斯滤波，并通过sobel算子得到各个边缘点处的梯度方向；

S400，分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点，并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距；

S500，筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点；

S600，提取出文字边缘点构成的连通区域作为文字区域；

S700，对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配，各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。

进一步地，在S400中，分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点的方法为，当沿着边缘点处的梯度方向的正方向或反方向的第i个像素点的灰度值Gray(i)满足条件Gray(i)＜Gray(i-1)并且Gray(i)＜Gray(i+1)时判断该像素点为灰度极小值点，Gray(i-1)为第i-1个像素点的灰度值；Gray(i+1)为第i+1个像素点的灰度值。

进一步地，在S500中，所述上沿阈值为所有边缘点的字边沿距的算数平均值的N倍，所述下沿阈值为所有边缘点的字边沿距的算数平均值的M倍，N取值范围为[0.8，2]；M取值范围为[-2，0.8]。

进一步地，在S600中，在提取出文字边缘点构成的连通区域作为文字区域之前，还要对文字边缘点构成的文字边缘线进行补全操作，所述补全操作的方法为以下步骤，

(由于甲骨拓片字形的笔画一般是单连通区域，个别笔段会出现断裂，且甲骨拓片字形笔画的像素亮度较高，而且比较连续，且在某个像素值区域比较集中，龟甲和兽骨在地下深埋上千年，由于受到老化与腐蚀，字形边缘呈现出凹凸不平连绵起伏的锯齿形状，因为边缘可能被甲骨的老化、磨损等原因产生缺失导致文字边缘点不能构成封闭的连通区域，所以需要对文字边缘点进行补全)；

S601，以下式计算文字边缘点构成的文字边缘线上每一个文字边缘点E的置信度Con(E)：

其中，q为文字边缘点E梯度方向的正方向和反方向搜索到的灰度极小值点之间的像素数；|neighbor_E|为文字边缘点E的长度和宽度均为字边沿距的大小的矩形邻域neighbor_E中的像素点的数量；

S602，计算文字边缘线上各个文字边缘点E的缺失度Loss(E)，

其中，norn_E为文字边缘线上当前文字边缘点与上一个文字边缘点之间灰度的像素间梯度值，

为文字边缘线上各个文字边缘点E的灰度梯度；

S603，以文字边缘点E为当前文字边缘点，以上一个文字边缘点到当前文字边缘点E的方向作为基准方向，判断当前文字边缘点的字边沿距的范围之内是否存在文字边缘点；当不存在文字边缘点则转到步骤S604，当不存在则以下一个相邻的文字边缘点作为当前文字边缘点并重新执行本步骤S603；

S604，判断当前文字边缘点的缺失度Loss(E)是否小于缺失阈值，如果小于则以下一个相邻的文字边缘点作为当前文字边缘点并转到S603，即检测当前文字边缘点的下一个相邻的文字边缘点；如果大于或等于则转到步骤S605；其中，缺失阈值取值范围为[0.001,0.006]；

S605，计算文字边缘线上的所有文字边缘点的灰度吻合度Fit(E)＝Con(E)·Loss(E)，并选取灰度吻合度最大的文字边缘点E_fit；

S606，复制文字边缘点E_fit填充到基准方向上当前文字边缘点的下一个相邻的空白位置；

S607，当文字边缘线的文字边缘点都被填充，文字边缘线形成一个闭合的连通区域则补全操作结束。

进一步地，在S700中，所述甲骨文数据库中预存有现有的已知甲骨文图像的及甲骨文图像对应的匹配值的数据库，甲骨文数据库的数据包括甲骨文图像及其对应的匹配值、甲骨文图像对应的字解。

进一步地，在S700中，甲骨文图像库中的甲骨文图像对应的匹配值以及各个文字区域的图像的匹配值计算方法为以下步骤：

S701：通过sobel算子获得甲骨文图像库中的甲骨文图像的边缘图像，并将边缘图像二值化得到二值化图像Edge(x,y)，x和y为像素点坐标值；

S702：计算二值化图像Edge(x,y)各个边缘像素点的领域量neighbor(x,y)：

其中，D为在边缘像素点(x,y)处的字边沿距；

S703：取二值化图像中所有的边缘像素点的领域量平均值作为匹配值。

进一步地，在S700中，匹配结果为甲骨文图像对应的简体字解。

本发明还提供了基于一种基于机器视觉的甲骨文识别系统，所述系统包括：存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序运行在以下系统的单元中：

拓片图像采集单元，用于利用线阵相机扫描甲骨文拓片得到拓片图像；

图像灰度化单元，用于将拓片图像灰度化得到拓片灰度图；

边缘点提取单元，用于通过Canny算子或Prewitt算子提取拓片灰度图的边缘点；

梯度计算单元，用于对各个边缘点进行高斯滤波，并通过sobel算子得到各个边缘点处的梯度方向；

字边沿距计算单元，用于分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点，并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距；

文字边缘筛选单元，用于筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点；

文字区域提取单元，用于提取出文字边缘点构成的连通区域作为文字区域；

甲骨文匹配单元，用于对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配，各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。

本发明的有益效果为：本发明提供一种基于机器视觉的甲骨文识别方法及系统，对于因甲骨文出土的历史原因导致甲骨划痕、风化、裂纹、坑洞等原因，能够较高准确率的对文字区域进行增强，保证了甲骨文文字区域的完整性和甲骨文提取可靠性，降低了甲骨文拓片的误检识别概率。

附图说明

通过对结合附图所示出的实施方式进行详细说明，本发明的上述以及其他特征将更加明显，本发明附图中相同的参考标号表示相同或相似的元素，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，在附图中：

图1所示为基于适应性蝙蝠仿生搜索算法的流程图；

图2所示为基于一种基于机器视觉的甲骨文识别系统图。

具体实施方式

以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述，以充分地理解本发明的目的、方案和效果。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

如图1所示为根据本发明的一种基于机器视觉的甲骨文识别方法的流程图，下面结合图1来阐述根据本发明的实施方式的一种基于机器视觉的甲骨文识别方法。

本发明提出一种基于机器视觉的甲骨文识别方法，具体包括以下步骤：

S100，利用线阵相机扫描甲骨文拓片得到拓片图像；

S200，将拓片图像灰度化得到拓片灰度图；

S300，通过Canny算子或Prewitt算子提取拓片灰度图的边缘点；

S600，提取出文字边缘点构成的连通区域作为文字区域；

S602，计算文字边缘线上各个文字边缘点E的缺失度Loss(E)，

其中，norn_E为文字边缘线上当前文字边缘点与上一个文字边缘点之间灰度的像素间梯度值，▽I_E为文字边缘线上各个文字边缘点E的灰度梯度；

其中，D为在边缘像素点(x,y)处的字边沿距；

优选地，对甲骨拓片灰度图像上的基于机器视觉的一种基于机器视觉的甲骨文识别方法，其关键内容部分可以用C++语言描述如下：

本发明的实施例提供的基于一种基于机器视觉的甲骨文识别系统，如图2所示为本发明的基于一种基于机器视觉的甲骨文识别系统图，该实施例的基于一种基于机器视觉的甲骨文识别系统包括：处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于一种基于机器视觉的甲骨文识别系统实施例中的步骤。

所述系统包括：存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序运行在以下系统的单元中：

图像灰度化单元，用于将拓片图像灰度化得到拓片灰度图；

所述基于一种基于机器视觉的甲骨文识别系统可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述基于一种基于机器视觉的甲骨文识别系统，可运行的系统可包括，但不仅限于，处理器、存储器。本领域技术人员可以理解，所述例子仅仅是基于一种基于机器视觉的甲骨文识别系统的示例，并不构成对基于一种基于机器视觉的甲骨文识别系统的限定，可以包括比例子更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述基于一种基于机器视觉的甲骨文识别系统还可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述基于一种基于机器视觉的甲骨文识别系统运行系统的控制中心，利用各种接口和线路连接整个基于一种基于机器视觉的甲骨文识别系统可运行系统的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述基于一种基于机器视觉的甲骨文识别系统的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述，但其并非旨在局限于任何这些细节或实施例或任何特殊实施例，从而有效地涵盖本发明的预定范围。此外，上文以发明人可预见的实施例对本发明进行描述，其目的是为了提供有用的描述，而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。

Claims

1.一种基于机器视觉的甲骨文识别方法，其特征在于，所述方法包括以下步骤：

S100，利用线阵相机扫描甲骨文拓片得到拓片图像；

S200，将拓片图像灰度化得到拓片灰度图；

S300，提取拓片灰度图的边缘点；

S300，对各个边缘点进行高斯滤波并计算各个边缘点处的梯度方向；

S600，将文字边缘点构成的连通区域作为文字区域；

其中，在提取出文字边缘点构成的连通区域作为文字区域之前，还要对文字边缘点构成的文字边缘线进行补全操作，所述补全操作的方法为以下步骤，

S602，计算文字边缘线上各个文字边缘点E的缺失度Loss(E)，

为文字边缘线上各个文字边缘点E的灰度梯度；

2.根据权利要求1所述的一种基于机器视觉的甲骨文识别方法，其特征在于，所述方法还包括：S700，对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配，各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。

3.根据权利要求1所述的一种基于机器视觉的甲骨文识别方法，其特征在于，在S400中，分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点的方法为，当沿着边缘点处的梯度方向的正方向或反方向的第i个像素点的灰度值Gray(i)满足条件Gray(i)<Gray(i-1)并且Gray(i)<Gray(i+1)时判断该像素点为灰度极小值点，Gray(i-1)为第i-1个像素点的灰度值；Gray(i+1)为第i+1个像素点的灰度值。

4.根据权利要求1所述的一种基于机器视觉的甲骨文识别方法，其特征在于，在S500中，所述上沿阈值为所有边缘点的字边沿距的算数平均值的N倍，所述下沿阈值为所有边缘点的字边沿距的算数平均值的M倍，N取值范围为[0.8，2]；M取值范围为[-2，0.8]。

5.根据权利要求2所述的一种基于机器视觉的甲骨文识别方法，其特征在于，在S700中，所述甲骨文数据库中预存有现有的已知甲骨文图像的及甲骨文图像对应的匹配值的数据库，甲骨文数据库的数据包括甲骨文图像及其对应的匹配值、甲骨文图像对应的字解。

6.根据权利要求2所述的一种基于机器视觉的甲骨文识别方法，其特征在于，在S700中，甲骨文图像库中的甲骨文图像对应的匹配值以及各个文字区域的图像的匹配值计算方法为以下步骤：

其中，D为在边缘像素点(x,y)处的字边沿距；

7.基于一种基于机器视觉的甲骨文识别系统，其特征在于，所述系统包括：存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序运行在以下系统的单元中：

图像灰度化单元，用于将拓片图像灰度化得到拓片灰度图；

甲骨文匹配单元，用于对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配，各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果；

S602，计算文字边缘线上各个文字边缘点E的缺失度Loss(E)，

为文字边缘线上各个文字边缘点E的灰度梯度；