CN117132998A

CN117132998A - 书法作品单个字体识别方法及其识别系统

Info

Publication number: CN117132998A
Application number: CN202311098107.XA
Authority: CN
Inventors: 支巧
Original assignee: Anhui Yiguan Culture Technology Co ltd
Current assignee: Anhui Yiguan Culture Technology Co ltd
Priority date: 2023-08-29
Filing date: 2023-08-29
Publication date: 2023-11-28
Anticipated expiration: 2043-08-29
Also published as: CN117132998B

Abstract

本发明涉及书法字体识别领域，尤其涉及书法作品单个字体识别方法及其识别系统，其中公开了书法作品单个字体识别方法，包括：通过光学字体识别模块识别所获得的图像中的单个字符，获取与单个字符相同的标准字符，将单个字符与标准字符分割为若干个笔画结构图像，并通过转换模块将若干个笔画结构图像转换为点阵图形式输出，获取每个点阵图各个点阵点之间的距离结果，并根据距离结果判断单个字符所对应的字体类型。本发明通过调整图像的方式来降低单个字符的形态对识别的影响，并进一步通过点阵图的转换方式将字符转换为点阵图，以转换点阵图的方式来降低字符的复杂度并进行计算和识别，最后实现对书法字体的准确判断。

Description

书法作品单个字体识别方法及其识别系统

技术领域

本发明涉及书法字体识别领域，尤其涉及书法作品单个字体识别方法及其识别系统。

背景技术

在日常的图文转换和各类的书籍转换中，通常会需要文字识别技术，现有的文字识别技术通常将各类形态的文字转换为标准字符，这种转换通常应用于印刷等存在标准字体的领域。

现有技术中公开的技术方案，通常是以将字符图像转换为二进制矩阵的形式来进行识别的，这种方式在识别过程中会丢失一定的字符形态信息，即这种方式在进行识别时，通常只能够判断当前书法作品的字符，而并不能准确判断当前书法作品所应用的字体类型，这就导致以这种方式进行转换的字符会以预设的标准字符来输出，而并不能自主识别书法作品的字体来进行输出。

发明内容

本发明针对现有技术存在的不足，提供如下技术方案：

书法作品单个字体识别方法，包括：

S1：字符提取：获取书法作品的图像，并通过光学字体识别模块识别所获得的图像中的单个字符。

S2：图像调整：获取与单个字符相同的标准字符，并将识别所得的字符调整至与标准字符等比例的状态，以降低单个字符的形态对识别的影响。

S3：笔画分割：将单个字符与标准字符分割为若干个笔画结构图像，并通过转换模块将若干个笔画结构图像转换为点阵图形式输出，以降低识别的复杂度。

S4：字体判断：获取每个点阵图各个点阵点之间的距离结果，并根据距离结果判断单个字符所对应的字体类型。

作为上述技术方案的改进，所述步骤S1包括以下步骤：

S11：将书法作品的图像输入至光学字体识别模块中。

S12：将识别书法作品进行特征检测和模块识别以获取单一字符。

作为上述技术方案的改进，所述步骤S2包括以下步骤：

S21：以单个字符和标准字符四周的最边界像素点作为边框临界点建立矩形框架。

S22：以标准字符作为参照对象，将单个字符进行竖向和横向的等比例调节，获得两组单向等比例测试图像。

S23：以标准字符作为参照对象，调节单个字符，直至单个字符的矩形框架与标准字符的矩形框架重合，得到等比例图像。

作为上述技术方案的改进，所述步骤S3包括以下步骤：

S31：通过转换模块将单个字符与标准字符转换为点阵图并输出。

S32：获取标准字符的笔画结构。

S33：扫描单个字符的点阵图数据，并按照标准字符的笔画结构来对单个字符的点阵图数据进行分割，得到若干个笔画结构的点阵图。

作为上述技术方案的改进，所述步骤S4包括以下步骤：

S41：以每种笔画结构图像的点阵图最边缘的重合点作为标准点，建立平面坐标系。

S42：根据平面坐标系中每个点阵点的位置来获取点阵图中每个点阵点距离原点之间的距离结果，并根据距离结果获得标准方差结果。

S43：计算单个字符与标准字符所对应的所有笔画结构图像的标准方差结果之间的平均值，并计算单个字符所获得的平均值与标准字符所获得的平均值之间的比值。

S44：设定阈值，若步骤S43所获得的比值超过这个阈值，则判定标准字符中存在相似字体，若步骤S43所获得的比值低于这个阈值，则判定标准字符中不存在相似字体，当超过阈值时，以比值最靠近1的结果所对应的标准字符作为识别结果，并返回识别结果所对应的字体类型。

作为上述技术方案的改进，所述步骤S43中比值的获取依赖于下式：

其中，表示根据距离结果获得的标准方差结果，n表示单一笔画结构图像中存在的点阵点数量，y_i表示第i个点阵点在平面坐标系上的纵坐标，x_i表示第i个点阵点在平面坐标系上的横坐标，(x₀，y₀)表示标准点的坐标，θ表示单个字符所对应的所有笔画结构图像的标准方差结果之间的平均值，m表示单个字符中笔画的数量，/>表示第l个笔画根据距离结果获得的标准方差结果，θ_N表示第N个标准字符所对应的所有笔画结构图像的标准方差结果之间的平均值，ω_N表示单个字符与第N个标准字符所对应的平均值之间的比值。

作为上述技术方案的改进，所述步骤S2执行前还需要执行以下步骤：

S01：将书法作品的图像输入至深度神经网络中进行特征提取。

S02：将提取的特征经过比较器与数据库中的字体进行对比，以获取书法作品所对应的字体。

书法作品单个字体识别系统，应用于如前述技术方案中任一项所述的书法作品单个字体识别方法，包括：光学字体识别模块、图像调整模块、图像分割模块、转换模块以及判断模块。

具体的，光学字体识别模块用于识别图像中的文字图像，并确定文字图像所对应的具体字符，图像调整模块用于对识别的单个字符进行大小规格的调整，图像分割模块用于将单个字符或者标准字符进行笔画结构的分割，转换模块用于将图像转换为点阵图的形式，判断模块用于计算每个点阵图各个点阵点之间的距离结果，并根据距离结果判断单个字符所对应的字体类型。

作为上述技术方案的改进，还包括：深度神经网络。

具体的，所述深度神经网络，用于对书法作品图像进行特征提取，并识别书法作品的相似字体以降低对比范围。

本发明的有益效果：

通过调整图像的方式来降低单个字符的形态对识别的影响，这种方式能够降低书法书写所导致的与标准字符之间的形态差距，降低识别结果的误差程度，并进一步通过点阵图的转换方式将字符转换为点阵图，以转换点阵图的方式来降低字符的复杂度，并同时保留了字符的形态信息，最后通过点阵图来计算距离结果，再根据距离结果来判断最后的识别结果，最后实现对书法字体的准确判断。

附图说明

图1为本发明经过步骤S2后得到的单一字符的各个形态图；

图2为图1转换为点阵图后的示意图；

图3为图2中剥离单一笔画结构图像后的示意图；

图4为图3中笔画结构图像在划分平面坐标系后的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例一

提供一种书法作品单个字体识别方法，包括：

这一步是为了方便在字体数据库中找到对应的字符，如图1所示，其中的原始字体即为提取所获得的单个字符。

具体的，所述步骤S1包括以下步骤：

S11：将书法作品的图像输入至光学字体识别模块中。

光学字体识别模块一般是指采用OCR技术对文字进行转换的技术，其属于现有技术中所公开的技术方案，具体步骤是通过特征检测和识别模块获取字符图像，然后将字符图像转换为二进制矩阵，并利用距离公式来算出矩阵中心到最远的距离，然后创建一个圆形的半径，并将其分割成更细颗粒的部分，在这个阶段，算法将每个分段与表示不同字体字符的矩阵数据库进行比较，最后确定统计上最常见的字符，将这个字符作为识别得到的单一字符。

在完成字符识别后，需要获取与这个单一字符相同，但是不同字体的标准字符，这个标准字符通常是存储在数据库中，即在数据库中存储若干种不同字体的字符库，只要确定单一字符，就能够找到与这个单一字符相同，但采用不同字体的标准字符。

由于人为书写存在一定的个人倾向，即会导致虽然字体相同，但是可能会出现纵向或者横向上的书写幅度的不同，为了降低个人书写所带来的影响，在这个标准字符的基础上，对单一字符进行调整。

具体的，所述步骤S2包括以下步骤：

即对单个字符以及标准字符的最边界位置进行限制，得到完全覆盖的矩形图像，而这个覆盖标准字符的矩形图像作为调整标准，具体的执行步骤S22与S23。

S23：以标准字符作为参照对象，调节单个字符，直至单个字符的矩形框架与标准字符的矩形框架重合，得到等比例图像

如图1中标准字体的右侧和下侧所示的图像，其为竖向的等比例测试图像与横向的等比例测试图像，以图1中所示出的“寸”字为例，竖向的等比例测试图像降低了书写所导致的笔画“亅”的高度差距，而横向等比例测试图像降低了书写所导致的“一”的长度差距，而等比例图像降低了书写字符与标准字符之间的整体差距。

在对图像处理后，为了降低整体识别的复杂度，采用笔画分割的方式降低单次计算的复杂程度。

具体的，所述步骤S3包括以下步骤：

转换模块通常是点阵图转换器，这种转换器可以将图像结构以点阵点的形式表现，而为了降低图像分割的计算量，将单个字符与标准字符转换为点阵图的形式进行输出，这样后续进行计算时，所计算的点并非是像素点，而是点阵图的点阵点，如图2所示，将图1中“寸”字不同情况下的形态结构都转换为点阵图的形式。

S32：获取标准字符的笔画结构。

由于已经知晓提取的标准字符，而标准字符的笔画结构是已知的状态，因此首先获取标准字符的笔画结构，这样得到了分割状态下的标准字符的各个笔画结构，例如“寸”的“一”、“亅”、“丶”这三个笔画结构，由于这个提取操作是基于转换为点阵图的标准字符，因此提取的笔画结构也是点阵图的形式。

根据标准字符的各个笔画结构来对单个字符的图像结构进行分解，虽然字体不同，但是笔画结构类似，因此可以根据标准字符的笔画结构，将单个字符中的相似笔画结构分离开，这些分离的操作是基于点阵图的形式，这样最后分离得到的笔画结构点阵图中包括多种不同字体下的标准字符的笔画结构，以及单个字符的笔画结构，这些结构均以点阵图的形式显示，如图3中提取的“寸”字中的“一”这一笔画结构，“寸”字不同情况下的“一”这一笔画结构都被转换为点阵图的形式。

在确定点阵图结构后，能够得到若干个点阵点，若能够确定一个标准位置，就能够计算出所有其他点之间的距离结果，基于距离结果就能够确定最相似的字体，具体的所述步骤S4包括以下步骤：

首先需要定位最准确地一个重合点，这个重合点可以作为x轴上的一点或者y轴上的一点，这种方式是为了保证笔画结构图像的点阵图上的所有点阵点都处在平面坐标系的第一象限中，降低计算结果的偏差度，而平面坐标系的原点位置可以随机选择，一般为了保证点阵图的计算准确度，以及图像大小不一致所导致的图像越界，通常只采用一个最边缘的点来确定计算的起始点，而坐标系的另一个位置为特定方式生成，但是需要保证能够完全包覆所有的点阵点。

以图3中的“一”这一笔画结构为例，其最边缘的点阵点可以作为最准确的重合点，这里以笔画的最左端的一点作为y轴上的一点，并且以高度最高的点阵图作为坐标系的定位高度，这里以竖向的等比例测试图像得到的笔画结构的点阵图(后记为点阵图a)作为高度来确定最高位置，即点阵图a上的最低点与x轴重合，在定位竖直方向的对齐位置以及高度后，只需要确定水平方向上的对其位置就能够确定所有点阵图的标准位置，这里以点阵图a的最高点所在的水平线作为水平对齐线，所有点阵图以这个水平线进行对齐，得到如图4所示的带有笔画结构的坐标系。

在确定平面坐标系后，点阵图中的每个点阵点的坐标都被确定(由于点阵点并非是单一的点，而是一个像素块，因此这里点阵点以像素块的中心点的坐标作为自身的坐标)，这样就将图像的相似性转换为若干个点阵点之间的距离计算，这个计算的结果需要采用标准方差进行进一步地修正，具体依赖于下式：

其中，表示根据距离结果获得的标准方差结果，n表示单一笔画结构图像中存在的点阵点数量，y_i表示第i个点阵点在平面坐标系上的纵坐标，x_i表示第i个点阵点在平面坐标系上的横坐标，(x₀，y₀)表示标准点的坐标。

虽然标准点的位置在不同坐标系中可能不同，但是每个点阵点之间的距离是固定的，因此采用上述标准方差的计算方式能够准确地计算每个点阵点到标准点之间的距离表示。

由于这种计算方式是依赖于点阵点的数量，若点阵点的数量过少，则会导致结果计算出现偏差，因此在转换为点阵图时，需要保证点阵点的转换规则至少为8bit，保证点阵点的数量足够，以此来稀释误差。

由于每个点阵图所具有的点阵点的数量不一致，若只计算标准方差可能会导致最后的结果产生较大的偏离，为了加强准确性，还进一步计算平均值，平均值的计算依赖于下式：

其中，θ表示单个字符所对应的所有笔画结构图像的标准方差结果之间的平均值，m表示单个字符中笔画的数量，表示第l个笔画根据距离结果获得的标准方差结果。

在确定单个字符与每个字体下的标注字符的平均值后，计算单个字符与每个字体下标准字符的比值，这个比值越靠近1，则单个字符与标准字符越相似，因此，最靠近1的那个比值所对应的标准字符为最相似字符，即比值最靠近1的标准字符所对应的字体类型就是识别所得到的单个字符的字体类型。

其中，比值的计算依赖于以下公式：

其中，θ表示单个字符所对应的所有笔画结构图像的标准方差结果之间的平均值，θ_N表示第N个标准字符所对应的所有笔画结构图像的标准方差结果之间的平均值，ω_N表示单个字符与第N个标准字符所对应的平均值之间的比值。

S44：设定阈值，若步骤S43所获得的比值超过这个阈值，则判定标准字符中存在相似字体，若步骤S43所获得的比值低于这个阈值，则判定标准字符中不存在相似字体。

前述计算方法中仅仅是对比哪个比值最靠近1，而最靠近1的结果却并不一定就是准确的相同字体，为了进一步保证识别的准确度，设定一个阈值，这个阈值是为了判断当前计算结果是否为相似字体，在确定为相似字体的情况下，当超过阈值时，以比值最靠近1的结果所对应的标准字符作为识别结果，并返回识别结果所对应的字体类型。

实施例二

在实施例一中所记载的技术方案虽然能够保证识别准确度，但是其每次计算都需要对数据库中的所有字体进行计算，其计算量较大，为了降低其计算量，提供以下方案：

具体的，所述步骤S2执行前还需要执行以下步骤：

通过深度神经网络来对输入的书法作品的图像进行特征提取，获取书法作品中的深层特征。

通过比较器对特征进行识别并与字体库中的标准字体进行比较，以最快的速度获得书法作品所对应的字体。

这里获取的字体通常是多个，并非是完全准确的字体类型，通过深度神经网络进行初步的筛选过滤，降低后续计算的复杂程度。

实施例三

为了与实施例一以及实施例二配合，提供一种书法作品单个字体识别系统，应用于如实施例一或者实施例二中任一项所述的书法作品单个字体识别方法，包括：

光学字体识别模块，用于识别图像中的文字图像，并确定文字图像所对应的具体字符；光学字体识别模块、图像调整模块、图像分割模块、转换模块以及判断模块。

光学字体识别模块用于识别图像中的文字图像，图像调整模块用于对识别的单个字符进行大小规格的调整，图像分割模块用于将单个字符或者标准字符进行笔画结构的分割，转换模块用于将图像转换为点阵图的形式，判断模块用于计算每个点阵图各个点阵点之间的距离结果，并根据距离结果判断单个字符所对应的字体类型。

包括：深度神经网络；

所述深度神经网络，用于对书法作品图像进行特征提取，并识别书法作品的相似字体以降低对比范围。

将书法作品输入至光学字体识别模块以及深度神经网络，通过光学字体识别模块来识别图像中的文字部分(即实施例一中所记载的单个字符)，获取当前图像所表示的文字，并通过深度神经网络来缩小字体所在的范围，并在字体数据库中找到文字所对应的若干个字体，得到这些字体的标准图像(即实施例一中所记载的标准字符)，通过图像调整模块将标准字符与单个字符进行大小调整，然后通过图像分割模块来将标准字符与单个字符进行笔画结构的分割，得到若干个笔画结构图像，并将其转换为点阵图的形式进行输出，最后通过判断模块来对每个点阵图之间的点阵点之间的距离结果进行计算，并根据计算结构来判断这一字符所对应的字体类型。

以上实施例仅用以说明本发明的技术方案，而非对其限制。

Claims

1.书法作品单个字体识别方法，其特征在于，包括：

S1：字符提取：获取书法作品的图像，并通过光学字体识别模块识别所获得的图像中的单个字符；

S2：图像调整：获取与单个字符相同的标准字符，并将识别所得的字符调整至与标准字符等比例的状态，以降低单个字符的形态对识别的影响；

S3：笔画分割：将单个字符与标准字符分割为若干个笔画结构图像，并通过转换模块将若干个笔画结构图像转换为点阵图形式输出，以降低识别的复杂度；

2.根据权利要求1所述的书法作品单个字体识别方法，其特征在于：所述步骤S1包括以下步骤：

S11：将书法作品的图像输入至光学字体识别模块中；

3.根据权利要求1所述的书法作品单个字体识别方法，其特征在于：所述步骤S2包括以下步骤：

S21：以单个字符和标准字符四周的最边界像素点作为边框临界点建立矩形框架；

S22：以标准字符作为参照对象，将单个字符进行竖向和横向的等比例调节，获得两组单向等比例测试图像；

4.根据权利要求3所述的书法作品单个字体识别方法，其特征在于：所述步骤S3包括以下步骤：

S32：获取标准字符的笔画结构。

S33：扫描单个字符的点阵图数据，并按照标准字符的笔画结构来对单个字符的点阵图数据进行分割，得到若干个笔画结构的点阵图。。

5.根据权利要求4所述的书法作品单个字体识别方法，其特征在于：所述步骤S4包括以下步骤：

S41：以每种笔画结构图像的点阵图最边缘的重合点作为标准点，建立平面坐标系；

S42：根据平面坐标系中每个点阵点的位置来获取点阵图中每个点阵点距离原点之间的距离结果，并根据距离结果获得标准方差结果；

S43：计算单个字符与标准字符所对应的所有笔画结构图像的标准方差结果之间的平均值，并计算单个字符所获得的平均值与标准字符所获得的平均值之间的比值；

S44：设定阈值，若步骤S43所获得的比值超过这个阈值，则判定标准字符中存在相似字体，若步骤S43所获得的比值低于这个阈值，则判定标准字符中不存在相似字体；

当超过阈值时，以比值最靠近1的结果所对应的标准字符作为识别结果，并返回识别结果所对应的字体类型。

6.根据权利要求5所述的书法作品单个字体识别方法，其特征在于：所述步骤S43中比值的获取依赖于下式：

7.根据权利要求1-6任一项所述的书法作品单个字体识别方法，其特征在于：所述步骤S2执行前还需要执行以下步骤：

S01：将书法作品的图像输入至深度神经网络中进行特征提取；

8.书法作品单个字体识别系统，应用于如权利要求1-7任一项所述的书法作品单个字体识别方法，其特征在于，包括：

光学字体识别模块，用于识别图像中的文字图像，并确定文字图像所对应的具体字符；

图像调整模块，用于对识别的单个字符进行大小规格的调整；

图像分割模块，用于将单个字符或者标准字符进行笔画结构的分割；

转换模块，用于将图像转换为点阵图的形式；

判断模块，用于计算每个点阵图各个点阵点之间的距离结果，并根据距离结果判断单个字符所对应的字体类型。

9.根据权利要求8所述的书法作品单个字体识别系统，其特征在于，包括：深度神经网络；