CN112232348B - 一种基于机器视觉的甲骨文识别方法及系统 - Google Patents

一种基于机器视觉的甲骨文识别方法及系统 Download PDF

Info

Publication number
CN112232348B
CN112232348B CN202010931079.5A CN202010931079A CN112232348B CN 112232348 B CN112232348 B CN 112232348B CN 202010931079 A CN202010931079 A CN 202010931079A CN 112232348 B CN112232348 B CN 112232348B
Authority
CN
China
Prior art keywords
edge
character
character edge
edge point
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010931079.5A
Other languages
English (en)
Other versions
CN112232348A (zh
Inventor
张殿典
张永康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202010931079.5A priority Critical patent/CN112232348B/zh
Publication of CN112232348A publication Critical patent/CN112232348A/zh
Application granted granted Critical
Publication of CN112232348B publication Critical patent/CN112232348B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于机器视觉的甲骨文识别方法及系统,通过将拓片图像灰度化得到拓片灰度图;通过提取拓片灰度图的边缘点;对各个边缘点进行高斯滤波,计算得到各个边缘点处的梯度方向,分别按各个边缘点处正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距;筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点;提取出文字边缘点构成的连通区域作为文字区域。对于因甲骨文出土的历史原因导致甲骨划痕、风化、裂纹、坑洞等原因,能够较高准确率的对文字区域进行增强,保证了甲骨文文字区域的完整性和甲骨文提取可靠性,降低了甲骨文拓片的误检识别概率。

Description

一种基于机器视觉的甲骨文识别方法及系统
技术领域
本发明涉及古文字识别技术领域,具体涉及一种基于机器视觉的甲骨文识别方法及系统。
背景技术
目前,甲骨文之类的古文字一般而言都还没有进入国标或者国际标准,大部分的甲骨文字在进行甲骨文考释的过程中,检索相应甲骨文字则需要大量的已标注的甲骨图像作为数据支撑,而且由于各种拓片只有甲骨文专家才能够人工标注耗时耗力,自甲骨文首次发现以来,据统计大部分出土的甲骨上刻有的单字约4500个,迄今已释读出的字仅约有2000个左右,因此甲骨中未释出的单词依旧占大多数,并且由于各地陆续出土的甲骨有各种变体,即很多时候同一个字由不同的专家辨识,难以识别出该字变体,出现很多识错辩错等情况。并且由于甲骨文出土的历史原因导致甲骨划痕、风化、裂纹、坑洞等原因,导致现有的这些识别甲骨文方法对甲骨文图像误检错误率的大幅增加,如何能从这种变形的甲骨文拓片图像中提取出甲骨文字并准确识别,一直是当前甲骨文字识别研究的热点问题。
发明内容
本发明的目的在于提出一种基于机器视觉的甲骨文识别方法及系统,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
由于一般拓片上常常由于甲骨划痕、风化、裂纹、坑洞等原因导致识别不准确的问题,所以在识别之前需要进行拓片图像的增强化,增强化之后方可进行进一步识别。
为了实现上述目的,根据本发明的一方面,提供一种基于机器视觉的甲骨文识别方法,所述方法包括以下步骤:
S100,利用线阵相机扫描甲骨文拓片得到拓片图像;
S200,将拓片图像灰度化得到拓片灰度图;
S300,通过Canny算子或Prewitt算子提取拓片灰度图的边缘点;
S300,对各个边缘点进行高斯滤波,并通过sobel算子得到各个边缘点处的梯度方向;
S400,分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点,并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距;
S500,筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点;
S600,提取出文字边缘点构成的连通区域作为文字区域;
S700,对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配,各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。
进一步地,在S400中,分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点的方法为,当沿着边缘点处的梯度方向的正方向或反方向的第i个像素点的灰度值Gray(i)满足条件Gray(i)<Gray(i-1)并且Gray(i)<Gray(i+1)时判断该像素点为灰度极小值点,Gray(i-1)为第i-1个像素点的灰度值;Gray(i+1)为第i+1个像素点的灰度值。
进一步地,在S500中,所述上沿阈值为所有边缘点的字边沿距的算数平均值的N倍,所述下沿阈值为所有边缘点的字边沿距的算数平均值的M倍,N取值范围为[0.8,2];M取值范围为[-2,0.8]。
进一步地,在S600中,在提取出文字边缘点构成的连通区域作为文字区域之前,还要对文字边缘点构成的文字边缘线进行补全操作,所述补全操作的方法为以下步骤,
(由于甲骨拓片字形的笔画一般是单连通区域,个别笔段会出现断裂,且甲骨拓片字形笔画的像素亮度较高,而且比较连续,且在某个像素值区域比较集中,龟甲和兽骨在地下深埋上千年,由于受到老化与腐蚀,字形边缘呈现出凹凸不平连绵起伏的锯齿形状,因为边缘可能被甲骨的老化、磨损等原因产生缺失导致文字边缘点不能构成封闭的连通区域,所以需要对文字边缘点进行补全);
S601,以下式计算文字边缘点构成的文字边缘线上每一个文字边缘点E的置信度Con(E):
Figure BDA0002670267770000021
其中,q为文字边缘点E梯度方向的正方向和反方向搜索到的灰度极小值点之间的像素数;|neighborE|为文字边缘点E的长度和宽度均为字边沿距的大小的矩形邻域neighborE中的像素点的数量;
S602,计算文字边缘线上各个文字边缘点E的缺失度Loss(E),
Figure BDA0002670267770000022
其中,nornE为文字边缘线上当前文字边缘点与上一个文字边缘点之间灰度的像素间梯度值,
Figure BDA0002670267770000023
为文字边缘线上各个文字边缘点E的灰度梯度;
S603,以文字边缘点E为当前文字边缘点,以上一个文字边缘点到当前文字边缘点E的方向作为基准方向,判断当前文字边缘点的字边沿距的范围之内是否存在文字边缘点;当不存在文字边缘点则转到步骤S604,当不存在则以下一个相邻的文字边缘点作为当前文字边缘点并重新执行本步骤S603;
S604,判断当前文字边缘点的缺失度Loss(E)是否小于缺失阈值,如果小于则以下一个相邻的文字边缘点作为当前文字边缘点并转到S603,即检测当前文字边缘点的下一个相邻的文字边缘点;如果大于或等于则转到步骤S605;其中,缺失阈值取值范围为[0.001,0.006];
S605,计算文字边缘线上的所有文字边缘点的灰度吻合度Fit(E)=Con(E)·Loss(E),并选取灰度吻合度最大的文字边缘点Efit
S606,复制文字边缘点Efit填充到基准方向上当前文字边缘点的下一个相邻的空白位置;
S607,当文字边缘线的文字边缘点都被填充,文字边缘线形成一个闭合的连通区域则补全操作结束。
进一步地,在S700中,所述甲骨文数据库中预存有现有的已知甲骨文图像的及甲骨文图像对应的匹配值的数据库,甲骨文数据库的数据包括甲骨文图像及其对应的匹配值、甲骨文图像对应的字解。
进一步地,在S700中,甲骨文图像库中的甲骨文图像对应的匹配值以及各个文字区域的图像的匹配值计算方法为以下步骤:
S701:通过sobel算子获得甲骨文图像库中的甲骨文图像的边缘图像,并将边缘图像二值化得到二值化图像Edge(x,y),x和y为像素点坐标值;
S702:计算二值化图像Edge(x,y)各个边缘像素点的领域量neighbor(x,y):
Figure BDA0002670267770000031
其中,D为在边缘像素点(x,y)处的字边沿距;
S703:取二值化图像中所有的边缘像素点的领域量平均值作为匹配值。
进一步地,在S700中,匹配结果为甲骨文图像对应的简体字解。
本发明还提供了基于一种基于机器视觉的甲骨文识别系统,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
拓片图像采集单元,用于利用线阵相机扫描甲骨文拓片得到拓片图像;
图像灰度化单元,用于将拓片图像灰度化得到拓片灰度图;
边缘点提取单元,用于通过Canny算子或Prewitt算子提取拓片灰度图的边缘点;
梯度计算单元,用于对各个边缘点进行高斯滤波,并通过sobel算子得到各个边缘点处的梯度方向;
字边沿距计算单元,用于分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点,并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距;
文字边缘筛选单元,用于筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点;
文字区域提取单元,用于提取出文字边缘点构成的连通区域作为文字区域;
甲骨文匹配单元,用于对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配,各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。
本发明的有益效果为:本发明提供一种基于机器视觉的甲骨文识别方法及系统,对于因甲骨文出土的历史原因导致甲骨划痕、风化、裂纹、坑洞等原因,能够较高准确率的对文字区域进行增强,保证了甲骨文文字区域的完整性和甲骨文提取可靠性,降低了甲骨文拓片的误检识别概率。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为基于适应性蝙蝠仿生搜索算法的流程图;
图2所示为基于一种基于机器视觉的甲骨文识别系统图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本发明的一种基于机器视觉的甲骨文识别方法的流程图,下面结合图1来阐述根据本发明的实施方式的一种基于机器视觉的甲骨文识别方法。
本发明提出一种基于机器视觉的甲骨文识别方法,具体包括以下步骤:
S100,利用线阵相机扫描甲骨文拓片得到拓片图像;
S200,将拓片图像灰度化得到拓片灰度图;
S300,通过Canny算子或Prewitt算子提取拓片灰度图的边缘点;
S300,对各个边缘点进行高斯滤波,并通过sobel算子得到各个边缘点处的梯度方向;
S400,分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点,并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距;
S500,筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点;
S600,提取出文字边缘点构成的连通区域作为文字区域;
S700,对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配,各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。
进一步地,在S400中,分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点的方法为,当沿着边缘点处的梯度方向的正方向或反方向的第i个像素点的灰度值Gray(i)满足条件Gray(i)<Gray(i-1)并且Gray(i)<Gray(i+1)时判断该像素点为灰度极小值点,Gray(i-1)为第i-1个像素点的灰度值;Gray(i+1)为第i+1个像素点的灰度值。
进一步地,在S500中,所述上沿阈值为所有边缘点的字边沿距的算数平均值的N倍,所述下沿阈值为所有边缘点的字边沿距的算数平均值的M倍,N取值范围为[0.8,2];M取值范围为[-2,0.8]。
进一步地,在S600中,在提取出文字边缘点构成的连通区域作为文字区域之前,还要对文字边缘点构成的文字边缘线进行补全操作,所述补全操作的方法为以下步骤,
(由于甲骨拓片字形的笔画一般是单连通区域,个别笔段会出现断裂,且甲骨拓片字形笔画的像素亮度较高,而且比较连续,且在某个像素值区域比较集中,龟甲和兽骨在地下深埋上千年,由于受到老化与腐蚀,字形边缘呈现出凹凸不平连绵起伏的锯齿形状,因为边缘可能被甲骨的老化、磨损等原因产生缺失导致文字边缘点不能构成封闭的连通区域,所以需要对文字边缘点进行补全);
S601,以下式计算文字边缘点构成的文字边缘线上每一个文字边缘点E的置信度Con(E):
Figure BDA0002670267770000051
其中,q为文字边缘点E梯度方向的正方向和反方向搜索到的灰度极小值点之间的像素数;|neighborE|为文字边缘点E的长度和宽度均为字边沿距的大小的矩形邻域neighborE中的像素点的数量;
S602,计算文字边缘线上各个文字边缘点E的缺失度Loss(E),
Figure BDA0002670267770000052
其中,nornE为文字边缘线上当前文字边缘点与上一个文字边缘点之间灰度的像素间梯度值,▽IE为文字边缘线上各个文字边缘点E的灰度梯度;
S603,以文字边缘点E为当前文字边缘点,以上一个文字边缘点到当前文字边缘点E的方向作为基准方向,判断当前文字边缘点的字边沿距的范围之内是否存在文字边缘点;当不存在文字边缘点则转到步骤S604,当不存在则以下一个相邻的文字边缘点作为当前文字边缘点并重新执行本步骤S603;
S604,判断当前文字边缘点的缺失度Loss(E)是否小于缺失阈值,如果小于则以下一个相邻的文字边缘点作为当前文字边缘点并转到S603,即检测当前文字边缘点的下一个相邻的文字边缘点;如果大于或等于则转到步骤S605;其中,缺失阈值取值范围为[0.001,0.006];
S605,计算文字边缘线上的所有文字边缘点的灰度吻合度Fit(E)=Con(E)·Loss(E),并选取灰度吻合度最大的文字边缘点Efit
S606,复制文字边缘点Efit填充到基准方向上当前文字边缘点的下一个相邻的空白位置;
S607,当文字边缘线的文字边缘点都被填充,文字边缘线形成一个闭合的连通区域则补全操作结束。
进一步地,在S700中,所述甲骨文数据库中预存有现有的已知甲骨文图像的及甲骨文图像对应的匹配值的数据库,甲骨文数据库的数据包括甲骨文图像及其对应的匹配值、甲骨文图像对应的字解。
进一步地,在S700中,甲骨文图像库中的甲骨文图像对应的匹配值以及各个文字区域的图像的匹配值计算方法为以下步骤:
S701:通过sobel算子获得甲骨文图像库中的甲骨文图像的边缘图像,并将边缘图像二值化得到二值化图像Edge(x,y),x和y为像素点坐标值;
S702:计算二值化图像Edge(x,y)各个边缘像素点的领域量neighbor(x,y):
Figure BDA0002670267770000061
其中,D为在边缘像素点(x,y)处的字边沿距;
S703:取二值化图像中所有的边缘像素点的领域量平均值作为匹配值。
进一步地,在S700中,匹配结果为甲骨文图像对应的简体字解。
优选地,对甲骨拓片灰度图像上的基于机器视觉的一种基于机器视觉的甲骨文识别方法,其关键内容部分可以用C++语言描述如下:
Figure BDA0002670267770000071
Figure BDA0002670267770000081
Figure BDA0002670267770000091
Figure BDA0002670267770000101
本发明的实施例提供的基于一种基于机器视觉的甲骨文识别系统,如图2所示为本发明的基于一种基于机器视觉的甲骨文识别系统图,该实施例的基于一种基于机器视觉的甲骨文识别系统包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于一种基于机器视觉的甲骨文识别系统实施例中的步骤。
所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
拓片图像采集单元,用于利用线阵相机扫描甲骨文拓片得到拓片图像;
图像灰度化单元,用于将拓片图像灰度化得到拓片灰度图;
边缘点提取单元,用于通过Canny算子或Prewitt算子提取拓片灰度图的边缘点;
梯度计算单元,用于对各个边缘点进行高斯滤波,并通过sobel算子得到各个边缘点处的梯度方向;
字边沿距计算单元,用于分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点,并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距;
文字边缘筛选单元,用于筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点;
文字区域提取单元,用于提取出文字边缘点构成的连通区域作为文字区域;
甲骨文匹配单元,用于对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配,各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。
所述基于一种基于机器视觉的甲骨文识别系统可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述基于一种基于机器视觉的甲骨文识别系统,可运行的系统可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是基于一种基于机器视觉的甲骨文识别系统的示例,并不构成对基于一种基于机器视觉的甲骨文识别系统的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于一种基于机器视觉的甲骨文识别系统还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于一种基于机器视觉的甲骨文识别系统运行系统的控制中心,利用各种接口和线路连接整个基于一种基于机器视觉的甲骨文识别系统可运行系统的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于一种基于机器视觉的甲骨文识别系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。

Claims (7)

1.一种基于机器视觉的甲骨文识别方法,其特征在于,所述方法包括以下步骤:
S100,利用线阵相机扫描甲骨文拓片得到拓片图像;
S200,将拓片图像灰度化得到拓片灰度图;
S300,提取拓片灰度图的边缘点;
S300,对各个边缘点进行高斯滤波并计算各个边缘点处的梯度方向;
S400,分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点,并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距;
S500,筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点;
S600,将文字边缘点构成的连通区域作为文字区域;
其中,在提取出文字边缘点构成的连通区域作为文字区域之前,还要对文字边缘点构成的文字边缘线进行补全操作,所述补全操作的方法为以下步骤,
S601,以下式计算文字边缘点构成的文字边缘线上每一个文字边缘点E的置信度Con(E):
Figure FDA0003216865390000011
其中,q为文字边缘点E梯度方向的正方向和反方向搜索到的灰度极小值点之间的像素数;|neighborE|为文字边缘点E的长度和宽度均为字边沿距的大小的矩形邻域neighborE中的像素点的数量;
S602,计算文字边缘线上各个文字边缘点E的缺失度Loss(E),
Figure FDA0003216865390000012
其中,nornE为文字边缘线上当前文字边缘点与上一个文字边缘点之间灰度的像素间梯度值,
Figure FDA0003216865390000013
为文字边缘线上各个文字边缘点E的灰度梯度;
S603,以文字边缘点E为当前文字边缘点,以上一个文字边缘点到当前文字边缘点E的方向作为基准方向,判断当前文字边缘点的字边沿距的范围之内是否存在文字边缘点;当不存在文字边缘点则转到步骤S604,当不存在则以下一个相邻的文字边缘点作为当前文字边缘点并重新执行本步骤S603;
S604,判断当前文字边缘点的缺失度Loss(E)是否小于缺失阈值,如果小于则以下一个相邻的文字边缘点作为当前文字边缘点并转到S603,即检测当前文字边缘点的下一个相邻的文字边缘点;如果大于或等于则转到步骤S605;其中,缺失阈值取值范围为[0.001,0.006];
S605,计算文字边缘线上的所有文字边缘点的灰度吻合度Fit(E)=Con(E)·Loss(E),并选取灰度吻合度最大的文字边缘点Efit
S606,复制文字边缘点Efit填充到基准方向上当前文字边缘点的下一个相邻的空白位置;
S607,当文字边缘线的文字边缘点都被填充,文字边缘线形成一个闭合的连通区域则补全操作结束。
2.根据权利要求1所述的一种基于机器视觉的甲骨文识别方法,其特征在于,所述方法还包括:S700,对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配,各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果。
3.根据权利要求1所述的一种基于机器视觉的甲骨文识别方法,其特征在于,在S400中,分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点的方法为,当沿着边缘点处的梯度方向的正方向或反方向的第i个像素点的灰度值Gray(i)满足条件Gray(i)<Gray(i-1)并且Gray(i)<Gray(i+1)时判断该像素点为灰度极小值点,Gray(i-1)为第i-1个像素点的灰度值;Gray(i+1)为第i+1个像素点的灰度值。
4.根据权利要求1所述的一种基于机器视觉的甲骨文识别方法,其特征在于,在S500中,所述上沿阈值为所有边缘点的字边沿距的算数平均值的N倍,所述下沿阈值为所有边缘点的字边沿距的算数平均值的M倍,N取值范围为[0.8,2];M取值范围为[-2,0.8]。
5.根据权利要求2所述的一种基于机器视觉的甲骨文识别方法,其特征在于,在S700中,所述甲骨文数据库中预存有现有的已知甲骨文图像的及甲骨文图像对应的匹配值的数据库,甲骨文数据库的数据包括甲骨文图像及其对应的匹配值、甲骨文图像对应的字解。
6.根据权利要求2所述的一种基于机器视觉的甲骨文识别方法,其特征在于,在S700中,甲骨文图像库中的甲骨文图像对应的匹配值以及各个文字区域的图像的匹配值计算方法为以下步骤:
S701:通过sobel算子获得甲骨文图像库中的甲骨文图像的边缘图像,并将边缘图像二值化得到二值化图像Edge(x,y),x和y为像素点坐标值;
S702:计算二值化图像Edge(x,y)各个边缘像素点的领域量neighbor(x,y):
Figure FDA0003216865390000031
其中,D为在边缘像素点(x,y)处的字边沿距;
S703:取二值化图像中所有的边缘像素点的领域量平均值作为匹配值。
7.基于一种基于机器视觉的甲骨文识别系统,其特征在于,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
拓片图像采集单元,用于利用线阵相机扫描甲骨文拓片得到拓片图像;
图像灰度化单元,用于将拓片图像灰度化得到拓片灰度图;
边缘点提取单元,用于通过Canny算子或Prewitt算子提取拓片灰度图的边缘点;
梯度计算单元,用于对各个边缘点进行高斯滤波,并通过sobel算子得到各个边缘点处的梯度方向;
字边沿距计算单元,用于分别按各个边缘点处的梯度方向的正方向和反方向搜索灰度极小值点,并计算搜索到的正反两个方向的灰度极小值点之间的切比雪夫距离作为字边沿距;
文字边缘筛选单元,用于筛选出所有字边沿距小于上沿阈值并且大于下沿阈值的边缘点作为文字边缘点;
文字区域提取单元,用于提取出文字边缘点构成的连通区域作为文字区域;
甲骨文匹配单元,用于对拓片灰度图中各个文字区域的图像与甲骨文数据库中的数据进行匹配,各个文字区域的图像的匹配值与甲骨文数据库中数据的匹配值的差值最小的数据作为匹配结果;
其中,在提取出文字边缘点构成的连通区域作为文字区域之前,还要对文字边缘点构成的文字边缘线进行补全操作,所述补全操作的方法为以下步骤,
S601,以下式计算文字边缘点构成的文字边缘线上每一个文字边缘点E的置信度Con(E):
Figure FDA0003216865390000041
其中,q为文字边缘点E梯度方向的正方向和反方向搜索到的灰度极小值点之间的像素数;|neighborE|为文字边缘点E的长度和宽度均为字边沿距的大小的矩形邻域neighborE中的像素点的数量;
S602,计算文字边缘线上各个文字边缘点E的缺失度Loss(E),
Figure FDA0003216865390000042
其中,nornE为文字边缘线上当前文字边缘点与上一个文字边缘点之间灰度的像素间梯度值,
Figure FDA0003216865390000043
为文字边缘线上各个文字边缘点E的灰度梯度;
S603,以文字边缘点E为当前文字边缘点,以上一个文字边缘点到当前文字边缘点E的方向作为基准方向,判断当前文字边缘点的字边沿距的范围之内是否存在文字边缘点;当不存在文字边缘点则转到步骤S604,当不存在则以下一个相邻的文字边缘点作为当前文字边缘点并重新执行本步骤S603;
S604,判断当前文字边缘点的缺失度Loss(E)是否小于缺失阈值,如果小于则以下一个相邻的文字边缘点作为当前文字边缘点并转到S603,即检测当前文字边缘点的下一个相邻的文字边缘点;如果大于或等于则转到步骤S605;其中,缺失阈值取值范围为[0.001,0.006];
S605,计算文字边缘线上的所有文字边缘点的灰度吻合度Fit(E)=Con(E)·Loss(E),并选取灰度吻合度最大的文字边缘点Efit
S606,复制文字边缘点Efit填充到基准方向上当前文字边缘点的下一个相邻的空白位置;
S607,当文字边缘线的文字边缘点都被填充,文字边缘线形成一个闭合的连通区域则补全操作结束。
CN202010931079.5A 2020-09-07 2020-09-07 一种基于机器视觉的甲骨文识别方法及系统 Active CN112232348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010931079.5A CN112232348B (zh) 2020-09-07 2020-09-07 一种基于机器视觉的甲骨文识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010931079.5A CN112232348B (zh) 2020-09-07 2020-09-07 一种基于机器视觉的甲骨文识别方法及系统

Publications (2)

Publication Number Publication Date
CN112232348A CN112232348A (zh) 2021-01-15
CN112232348B true CN112232348B (zh) 2021-10-01

Family

ID=74116607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010931079.5A Active CN112232348B (zh) 2020-09-07 2020-09-07 一种基于机器视觉的甲骨文识别方法及系统

Country Status (1)

Country Link
CN (1) CN112232348B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101881999A (zh) * 2010-06-21 2010-11-10 安阳师范学院 甲骨文视频输入系统及实现方法
CN101950418A (zh) * 2010-08-26 2011-01-19 北京中创信测科技股份有限公司 一种图像质量评价方法和装置
CN103488798A (zh) * 2013-10-14 2014-01-01 大连民族学院 一种甲骨文自动识别方法
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN108510491A (zh) * 2018-04-04 2018-09-07 深圳市未来媒体技术研究院 虚化背景下人体骨骼关键点检测结果的过滤方法
CN108664996A (zh) * 2018-04-19 2018-10-16 厦门大学 一种基于深度学习的古文字识别方法及系统
CN109871904A (zh) * 2019-03-11 2019-06-11 广东工业大学 甲骨文字识别模型及训练方法、系统、设备、计算机介质
CN111539437A (zh) * 2020-04-27 2020-08-14 西南大学 基于深度学习的甲骨文偏旁的检测与识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563393A (zh) * 2017-09-14 2018-01-09 安阳师范学院 一种甲骨文图片局部纹理特征的提取及匹配方法及系统
CN109215026B (zh) * 2018-09-29 2022-02-11 广东工业大学 一种基于机器视觉的高速准确led缺陷检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101881999A (zh) * 2010-06-21 2010-11-10 安阳师范学院 甲骨文视频输入系统及实现方法
CN101950418A (zh) * 2010-08-26 2011-01-19 北京中创信测科技股份有限公司 一种图像质量评价方法和装置
CN103488798A (zh) * 2013-10-14 2014-01-01 大连民族学院 一种甲骨文自动识别方法
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN108510491A (zh) * 2018-04-04 2018-09-07 深圳市未来媒体技术研究院 虚化背景下人体骨骼关键点检测结果的过滤方法
CN108664996A (zh) * 2018-04-19 2018-10-16 厦门大学 一种基于深度学习的古文字识别方法及系统
CN109871904A (zh) * 2019-03-11 2019-06-11 广东工业大学 甲骨文字识别模型及训练方法、系统、设备、计算机介质
CN111539437A (zh) * 2020-04-27 2020-08-14 西南大学 基于深度学习的甲骨文偏旁的检测与识别方法

Also Published As

Publication number Publication date
CN112232348A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN110008809B (zh) 表格数据的获取方法、装置和服务器
CN109117848B (zh) 一种文本行字符识别方法、装置、介质和电子设备
CN110838126B (zh) 细胞图像分割方法、装置、计算机设备和存储介质
CN109740606B (zh) 一种图像识别方法及装置
CN114119676B (zh) 基于多特征信息融合的目标检测跟踪识别方法和系统
CN109919002B (zh) 黄色禁停线识别方法、装置、计算机设备及存储介质
CN105469026A (zh) 针对文档图像的水平和垂直线检测和移除
US20150131912A1 (en) Systems and methods for offline character recognition
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN109508716B (zh) 一种图像文字的定位方法及装置
CN109389110B (zh) 一种区域确定方法及装置
CN112818952A (zh) 煤岩分界线的识别方法、装置及电子设备
CN112749673A (zh) 一种基于遥感影像智能提取储油罐库存的方法及装置
US9965678B2 (en) Method for recognizing table and flowchart in document images
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
CN110751013B (zh) 场景识别方法、装置和计算机可读存储介质
CN118430005A (zh) 一种输电杆塔图纸信息抽取方法、装置及设备
CN110147785B (zh) 图像识别方法、相关装置和设备
CN108694411B (zh) 一种识别相似图像的方法
CN113610052A (zh) 一种基于深度学习的隧道渗漏水自动识别方法
CN112232348B (zh) 一种基于机器视觉的甲骨文识别方法及系统
KR101807566B1 (ko) 바코드 검출 방법 및 장치
Xu et al. Tolerance Information Extraction for Mechanical Engineering Drawings–A Digital Image Processing and Deep Learning-based Model
CN110334560B (zh) 一种二维码定位方法和装置
Boiangiu et al. Handwritten documents text line segmentation based on information energy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant