CN117496537B

CN117496537B - 一种基于改进的形状特征匹配的书法书写质量评价方法

Info

Publication number: CN117496537B
Application number: CN202311480424.8A
Authority: CN
Inventors: 张超; 陈燕洁; 叶仕承; 林凯欣
Original assignee: Guangdong Xinyu Information Technology Co ltd
Current assignee: Guangdong Xinyu Information Technology Co ltd
Priority date: 2023-11-08
Filing date: 2023-11-08
Publication date: 2024-04-23
Anticipated expiration: 2043-11-08
Also published as: CN117496537A

Abstract

本发明涉及图像智能评分技术领域，公开一种基于改进的形状特征匹配的书法书写质量评价方法，包括以下步骤：采用改进的YoloV8对文字进行位置定位、分割和骨架提取，对母案和待评价作品做文字分割、定位和骨架提取，分割出每个文字后需要对母案的文字做对齐和配准工作，让待评价作品的文字跟母案进行对齐，与评价工作进行对应；利用文本骨架和关键控制点对字体整体书写相似度评价，采用针对书法改进的形状上下文算法进行字体书法总体似度评价；对主维度字体评分，对书法的笔法、笔画、结构和流畅度进行分开维度评价：根据条件评价和相似性对比融合，获取整体分数。该评价方法能够高效且准确地对书法进行评分，保证公平性和准确性。

Description

一种基于改进的形状特征匹配的书法书写质量评价方法

技术领域

本发明涉及图像智能评分技术领域，尤其涉及一种基于改进的形状特征匹配的书法书写质量评价方法。

背景技术

书法艺术具有较高的主观性，不同的评审人员可能对同一幅作品有不同的看法。人工测评容易受到个体审美、文化背景等因素的影响，难以保持一致性和客观性。书法临摹不仅涉及到字形的准确度，还包括线条流畅度、墨水的使用、意境表达等多个方面。

不同的评审人员可能对标准的理解存在差异，导致评分的不一致性。传统的人工评分存在无法全面准确稳定地进行测评，对大规模考试中的公平性和准确性产生影响的问题，同时由于大规模考试评测的需求导致人工评分工作量巨大，耗时费力。

发明内容

为解决现有技术中传统的人工评分存在无法全面准确稳定地进行测评，对大规模考试中的公平性和准确性产生影响的问题，本发明提供了一种基于改进的形状特征匹配的书法书写质量评价方法。

本发明的目的可以通过以下技术方案实现：

一种基于改进的形状特征匹配的书法书写质量评价方法，包括以下步骤：

S1：采用改进的YoloV8对隶书、楷书以及硬笔书法的文字进行位置定位、分割和骨架提取，对不同的书法字体进行注意力改进；

S2：对母案和待评价作品做文字分割、定位和骨架提取，分割出每个文字后需要对母案的文字做对齐和配准工作，让待评价作品的文字在空间上跟母案进行对齐，与评价工作进行对应；

S3：利用S1提取的文本骨架和关键控制点对字体的整体书写相似度进行评价，采用针对书法改进的形状上下文算法进行字体书法总体似度评价；

S4：对主维度字体评分之后，对书法的笔法、笔画、结构和流畅度进行分开维度评价；

S5：根据条件评价和相似性对比融合以及结合S3中字体书写相似度M、S4中书法的笔法I、笔画J、流畅度K和结构L的评价输出，获取整体分数S。

优选的，所述对母案的文字做对齐和配准工作中对齐的方法采用改进的迭代最近点方法，对待评测图像和母案图像的文字二维点云进行二维配准对齐。

优选的，所述针对书法改进的形状上下文算法进行字体书法总体似度评价，包括以下流程：

采用S1提取的文本骨架和关键控制点作为形状上下文的控制点集，每个点集包含一组二维坐标点作为特征点；

对于每个特征点，计算其与其他特征点之间的极坐标距离和角度，将所述距离和角度分别以直方图的形式表示，所述直方图即为该特征点的形状上下文；

计算两个文字形状之间的形状上下文距离，将所有特征点之间的形状上下文距离累加，得到两个形状之间的总体形状上下文距离。

优选的，所述对书法的笔法进行评价，包括以下步骤：

数据预处理，对书法图像进行预处理，提取笔画顺序信息，表示为序列数据；

LSTM网络构建，搭建LSTM网络，输入顺序笔画特征，输出笔画以及当前笔画与前后笔画关系的表示向量；

注意力机制，在LSTM上加入注意力层，使其自动聚焦重点笔画；

笔法识别，基于LSTM输出添加分类分支，识别当前笔画的笔法类别，笔法评分，连接一个回归分支，根据LSTM特征给出笔法运用的评分；结构化打分，根据笔画在整体结构中的位置，给予不同权重；

输出结果，对新作品根据模型给出笔画顺序评价、笔法运用评分及改进建议；

通过LSTM及注意力机制，显示建模笔法顺序与结构信息，评判笔法是否合理恰当，输出更可靠的书法笔法质量评价结果。

优选的，所述对书法的笔画评测采用ResNet-50模型，包括以下步骤：

收集带有笔画的书法图像数据集，每个图像标注有相应的笔画信息；

使用预训练的ResNet-50模型，在Image Net数据集上预训练的权重；

根据需求调整网络的输出层，以适应笔画评估的具体需求；

定义适当的损失函数，以均方误差，用于比较模型输出和笔画标签之间的差异；

选择适当Adam作为优化器，在预备的数据集上训练模型，训练过程中，监控所述模型在验证集上的性能，以便在合适的时候停止训练，避免过拟合。

优选的，所述笔画结构的准确性评价，具体包括：

将书法作品的笔画以节点形式进行表达，笔画之间的联系表示为边；

使用GCN图卷积网络，学习笔画图的表示，所述卷积网络通过消息传递学习笔画结构信息；

所述卷积网络输出每个笔画的向量表示，反映其在结构中的位置信息，基于所述笔画的向量表示，评分每个笔画的上笔、下笔和转折结构的准确性；

使用图注意力机制，识别结构美的重点部分；

全连接层综合所有笔画的结构评分，给出全局结构美的评分。

优选的，所述流畅度的测评的算法如下：

使用ORB特征提取算法从书法图像中提取特征点和描述子；

将两幅书法图像的特征点进行匹配，得到特征点间的对应关系；

测量特征点的对应关系，所述特征点的对应关系包括：匹配密度、一致性和稳定性；

按照制定的流畅度评估指标对书法图像中的字体进行流畅度评估。

本发明的有益效果为：

(1)通过根据条件评价和相似性对比融合以及结合S3中字体书写相似度M、S4中书法的笔法I、笔画J、流畅度K和结构L的评价输出，获取整体分数S，使用整体分数作为书法的综合性评分，也提高了评分的准确性和公正性，同时对不同的书法进行个性化的指导和建议，分析技巧和风格，能够针对性提高学生的书法能力。

(2)通过智能系统对书法作品进行评价，大大减轻了人工评分工作量巨大，耗死费力的负担，提高评价的工作效率；结合注意力机制能够更好地实现多级注意力，模块化学习，改善特征表达从而提升文本检测性能。

(3)通过使用各类算法对文本轮廓和笔画顺序等细节的调整，能够准确进行匹配，保证一致性，给出对应的修改建议，不仅起到了高效准确的智能评分而且能够给出改善意见，完善评分的流程。

附图说明

为了便于本领域技术人员理解，下面结合附图对本发明作进一步的说明。

图1为本发明在一实施例中提供的一种基于改进的形状特征匹配的书法书写质量评价方法的具体步骤；

图2为本发明在一实施例中提供的针对书法改进的形状上下文算法进行字体书法总体似度评价流程；

图3为本发明在一实施例中提供的对所采用的笔法技巧进行评价的步骤；

图4为本发明在一实施例中提供的采用ResNet-50对书法的笔画进行评测的步骤；

图5为本发明在一实施例中提供的对笔画结构的评测方法的步骤；

图6为本发明在一实施例中提供的建模笔迹的生成过程中判断流畅度的算法步骤。

具体实施方式

为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明的具体实施方式、结构、特征及其功效，详细说明如下。

一种基于改进的形状特征匹配的书法书写质量评价方法，如图1所示，包括以下步骤：

S1：采用改进的YoloV8对隶书、楷书以及硬笔书法的文字进行位置定位、分割、骨架提取，对不同的书法字体进行注意力改进；

所述YoloV8是物体检测算法YOLO系列的第八个版本，在改进前，YoloV8使用可分离卷积来提高感受野，改进后的YoloV8使用了大量的空洞卷积以及残差连接等技术，可以将感受野进一步扩大，提高检测的精度。并且，改进前YoloV8的模型很大，需要大量的计算资源才能运行，而在改进后，使用了轻量化的网络结构，模型大小缩小一半，可以在更加轻便的设备上运行。改进前的YoloV8监测精度还有待提升，而在改进后，使用了更加高级的直接回归方法，检测精度得到了明显提高。同时，在改进前YoloV8的检测速度不够快，改进后，通过对骨干网络的优化，以及使用多级预测技术，检测速度得到了明显提高。

向主干网络中引入全息注意力机制即通道注意力和空间注意力的串联结构，再节约参数和算力的同时起到了对各种不同书法字体的分割和定位以及骨架提取功能。GAM模块首先进行特征收集，使用全局平均池化和最大池化等方式收集不同位置的局部信息，然后是激发(Excite)过程，使用堆叠的全连接网络进行非线性转换，学习权重参数。再通过点积，将权重向量与原始特征进行注意力融合，得到增强的特征表示。在损失函数中加入GAM模块注意力权重的损失，增强注意力学习。可以在多尺度特征图上部署GAM模块，实现多级注意力。GAM模块可以有效学习到文本边界等关键区域，改善特征表达。

在推理时直接使用注意力融合的特征，无需额外计算开销。相比CBAM等早期注意力机制，GAM可以学习更抽象的注意力表示，全局融合信息，并保持高效。这可以增强YOLOv8对关键文本特征的学习与表达，从而提升文本检测性能。

S2：对母案和待评价作品做文字分割、定位、骨架提取，分割出每个文字后需要对母案的文字做对齐和配准工作，让待评价作品的文字在空间上跟母案进行对齐，与评价工作进行对应；

书法临摹AI自动化评价的重要性在于可以通过计算机视觉技术和人工智能算法来自动评价书法临摹作品的质量。这种方法可以大大减轻人工阅卷的负担，并且可以提高评分的准确性和公正性。同时，评价系统能够根据学生的临摹作品，提供个性化的指导和建议。它可以分析学生的临摹风格和技巧，为学生量身定制提升计划，指出不足并提供针对性的改进方案，帮助学生更有针对性地提高书法临摹水平。AI评价系统能够积累大量的评价数据，进行深度分析和挖掘。这些数据不仅可以用于学生的个体评估，还可以用于教学质量的分析和改进，为教育决策提供科学依据。

进一步的，在本申请的一种优选实施例中，所述对母案的文字做对齐和配准工作中对齐的方法采用改进的迭代最近点方法，对待评测图像和母案图像的文字二维点云进行二维配准对齐。

由于隶书、楷书、硬笔字等书写字体的风格不同，粗细程度不同，传统的ICP配准工作对于边缘细节无法把握，且由于待匹配图像经常由于学生书写潦草整洁度不高，导致配准失败。

本发明针对以上问题做如下改进：

①替换距离计算方法：使用基于哈希的距离计算方法，比传统欧式距离更适合计算笔画形状的相似度。

②加入笔画方向约束：在匹配点对时，添加笔画方向差异作为约束条件，使匹配更符合笔画运笔方向。

③局部特征匹配：在ICP迭代匹配之前，先使用SIFT等算法匹配文本局部特征，获取初始匹配对。

④使用Ramer–Douglas–Peucker算法将文本轮廓近似为多边形，减少轮廓噪声的影响。

⑤加入结构损失：在优化目标中，加入轮廓点顺序结构的损失，保持轮廓结构一致性。

⑥迭代优化策略：采用模拟退火等优化策略，避免陷入局部最优解。

⑦使用LSTM序列模型提取笔画顺序特征，与ICP配合使用。通过这些改进，可以大幅提升ICP算法在书法文本形状匹配上的效果，使其更准确地计算不同书法作品之间的形状相似度。在经过以上配准后，得到待配准图像针对母案的空间转换关系(x_t,y_t,θ_t)，其中x_t是x方向的平移量，y_t是y方向的平移量，θ_t是旋转量。平移后，再针对母案的图片大小，对待评价图片进行图片ROI截取，使得其两个图像大小一致。

进一步的，在本申请的一种优选实施例中，所述针对书法改进的形状上下文算法进行字体书法总体似度评价，如图2所示，包括以下流程：

S11：采用S1提取的文本骨架和关键控制点作为形状上下文的控制点集，每个点集包含一组二维坐标点作为特征点；

S12：对于每个特征点，计算其与其他特征点之间的极坐标距离和角度，将所述距离和角度分别以直方图的形式表示，所述直方图即为该特征点的形状上下文；

S13：计算两个文字形状之间的形状上下文距离，将所有特征点之间的形状上下文距离累加，得到两个形状之间的总体形状上下文距离。对于每个特征点的形状上下文直方图，可以使用直方图距离度量方法计算两个特征点之间的形状上下文距离。

本方法针对隶书、楷书以及钢笔字的特性对形状上下文算法做了以下改进：①替换距离计算方法：使用包含笔画方向约束的距离度量，如方向直方图的EMD距离。②增加多尺度shape context：在多个尺度下提取shape context特征，综合多尺度信息。③加入结构化打分：针对不同书写顺序phase给予不同权重，保持结构一致性。④使用深度特征提取：使用卷积神经网络等提取深层形状特征，而不仅仅是轮廓点分布。⑤端到端打分回归：将shape context特征输入全连接网络，进行端到端的打分回归预测。⑥增加作品风格特征：配合使用风格特征，进行风格一致性约束的评测。

通过这些改进，可以充分发挥shape context算法建模笔画形状分布的优势，使其更适用于书法艺术品的自动评测，输出更可靠的质量打分。

进一步的，在本申请的一种优选实施例中，所述对书法的笔法进行评价，如图3所示，包括以下步骤：

S21：数据预处理，对书法图像进行预处理，提取笔画顺序信息，表示为序列数据；

S22：LSTM网络构建，搭建LSTM网络，输入顺序笔画特征，输出笔画以及当前笔画与前后笔画关系的表示向量；

S23：注意力机制，在LSTM上加入注意力层，使其自动聚焦重点笔画；

S24：笔法识别，基于LSTM输出添加分类分支，识别当前笔画的笔法类别，笔法评分，连接一个回归分支，根据LSTM特征给出笔法运用的评分；结构化打分，根据笔画在整体结构中的位置，给予不同权重；

S25：输出结果，对新作品根据模型给出笔画顺序评价、笔法运用评分及改进建议；

S26：通过LSTM及注意力机制，显示建模笔法顺序与结构信息，评判笔法是否合理恰当，输出更可靠的书法笔法质量评价结果。

进一步的，在本申请的一种优选实施例中，所述对书法的笔画评测采用ResNet-50模型，如图4所示，包括以下步骤：

S31：收集带有笔画的书法图像数据集，每个图像标注有相应的笔画信息；

S32：使用预训练的ResNet-50模型，在ImageNet数据集上预训练的权重；

S33：根据需求调整网络的输出层，以适应笔画评估的具体需求；

S34：定义适当的损失函数，以均方误差，用于比较模型输出和笔画标签之间的差异；

S35：选择适当Adam作为优化器，在预备的数据集上训练模型，训练过程中，监控所述模型在验证集上的性能，以便在合适的时候停止训练，避免过拟合。

进一步的，在本申请的一种优选实施例中，所述笔画结构的准确性评价，如图5所示，具体包括：

S41：将书法作品的笔画以节点形式进行表达，笔画之间的联系表示为边；

S42：使用GCN图卷积网络，学习笔画图的表示，所述卷积网络通过消息传递学习笔画结构信息；

S43：所述卷积网络输出每个笔画的向量表示，反映其在结构中的位置信息，基于所述笔画的向量表示，评分每个笔画的上笔、下笔、转折结构的准确性；

S44：使用图注意力机制，识别结构美的重点部分；

S45：全连接层综合所有笔画的结构评分，给出全局结构美的评分。

进一步的，在本申请的一种优选实施例中，所述流畅度的测评的算法如图6所示，过程如下：

S51：使用ORB特征提取算法从书法图像中提取特征点和描述子；

S52：将两幅书法图像的特征点进行匹配，得到特征点间的对应关系；

S53：测量特征点的对应关系，所述特征点的对应关系包括：匹配密度、一致性和稳定性；

S54：按照制定的流畅度评估指标对书法图像中的字体进行流畅度评估。

所述描述子是图像处理和计算机视觉领域中的一种数学工具，用于表示像中的局部特征。描述子通常从图像中提取并表征局部图像结构、边缘、纹理等信息。通过对图像局部特征的描述，可用于图像匹配、目标跟踪和目标识别等应用。描述子通常具有尺度不变性和旋转不变性等性质，使得它们能够在不同尺度和旋转角度下有效地匹配和比较图像特征，从而提高图像处理和计算机视觉任务的准确性和效率。常见的描述子包括SIFT、SURF、ORB和FAST等。

所述流畅度评估指标中，通过匹配密度，计算特征点的匹配数量或密度。匹配数量较多的区域通常代表书法字迹比较连贯；通过计算匹配点的一致性，即匹配点的分布是否符合书法字迹的方向和形状；通过测量匹配点在不同图像之间的稳定性用以对书法流畅度进行测评，稳定性较高的匹配点表示书法字迹在不同图像中保持一致。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭示如上，然而并非用以限定本发明，任何本领域技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种基于改进的形状特征匹配的书法书写质量评价方法，其特征在于，包括以下步骤：

S2：对母案和待评价作品做文字分割、定位和骨架提取，分割出每个文字后对母案的文字进行对齐和配准，使得待评价作品的文字在空间上与母案的文字对齐，并与评价工作对应；

S3：利用步骤S1提取的文本骨架和关键控制点对字体的整体书写相似度进行评价，采用针对书法改进的形状上下文算法进行字体书法总体相似度评价；

S5：根据条件评价和相似度对比融合以及结合步骤S3中字体书法相似度M、步骤S4中书法的笔法I、笔画J、流畅度K和结构L的评价输出，获取整体分数S；

其中，

所述对母案的文字做对齐和配准工作中对齐的方法采用改进的迭代最近点方法，对待评测图像和母案图像的文字二维点云进行二维配准对齐；

所述针对书法改进的形状上下文算法进行字体书法总体相似度评价，包括以下流程：

采用步骤S1提取的文本骨架和关键控制点作为形状上下文的控制点集，每个点集包含一组二维坐标点作为特征点；

计算两个文字形状之间的形状上下文距离，将所有特征点之间的形状上下文距离累加，得到两个形状之间的总体形状上下文距离；

所述对书法的笔法进行评价，包括以下步骤：

数据预处理，对书法图像进行预处理,提取笔画顺序信息,表示为序列数据；

通过LSTM及注意力机制，显示建模笔法顺序与结构信息，评判笔法是否合理恰当，输出更可靠的书法笔法质量评价结果；

所述对书法的笔画评测采用ResNet-50模型，包括以下步骤：

根据需求调整网络的输出层，以适应笔画评估的具体需求；

定义损失函数，以均方误差，用于比较模型输出和笔画标签之间的差异；

选择Adam作为优化器，在预备的数据集上训练模型，训练过程中，监控所述模型在验证集上的性能，以便在停止训练，避免过拟合；

所述笔画结构的准确性评价，具体包括：

使用图注意力机制，识别结构美的重点部分；

全连接层综合所有笔画的结构评分，给出全局结构美的评分；

所述流畅度的测评的算法如下：

使用ORB特征提取算法从书法图像中提取特征点和描述子；