CN112784845A

CN112784845A - 手写文字检测方法以及电子设备、存储装置

Info

Publication number: CN112784845A
Application number: CN202110036357.5A
Authority: CN
Inventors: 汤琦璇; 王晓斐; 王忍宝
Original assignee: Anhui Toycloud Technology Co Ltd
Current assignee: Anhui Toycloud Technology Co Ltd
Priority date: 2021-01-12
Filing date: 2021-01-12
Publication date: 2021-05-11

Abstract

本申请公开了一种手写文字检测方法以及电子设备、存储装置，其中，手写文字检测方法包括：获取用户的待检测图像，并获取若干标准手写文字的第一文字特征；其中，待检测图像包含若干待测手写文字，标准手写文字的文字属性满足预设规范条件；识别待检测图像，得到若干待测手写文字的第二文字特征；获取若干待测手写文字的第二文字特征分别与若干标准手写文字的第一文字特征之间特征相似度；基于特征相似度，得到待测手写文字的规范检测结果。上述方案，能够提高手写文字检测的准确性。

Description

手写文字检测方法以及电子设备、存储装置

技术领域

本申请涉及图像识别技术领域，特别是涉及一种手写文字检测方法以及电子设备、存储装置。

背景技术

随着电子信息技术的发展，文字识别在教育、办公等诸多场景得到了广泛应用。在现实场景中，教育、办公等诸多场景通常要求用户手写文字合乎一定规范，以确保文字识别具有较高的准确率；此外，在阅卷等特殊场景，手写文字是否合乎规范也是评分的重要参考依据之一。有鉴于此，如何提高手写文字检测的准确性成为极具研究价值的课题。

发明内容

本申请主要解决的技术问题文本是提供一种手写文字检测方法以及电子设备、存储装置，能够提高手写文字检测的准确性。

为了解决上述问题文本，本申请第一方面提供了一种手写文字检测方法，包括：获取用户的待检测图像，并获取若干标准手写文字的第一文字特征；其中，待检测图像包含若干待测手写文字，标准手写文字的文字属性满足预设规范条件；识别待检测图像，得到若干待测手写文字的第二文字特征；获取若干待测手写文字的第二文字特征分别与若干标准手写文字的第一文字特征之间特征相似度；基于特征相似度，得到待测手写文字的规范检测结果。

为了解决上述问题文本，本申请第二方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面中的手写文字检测方法。

为了解决上述问题文本，本申请第三方面提供了一种存储装置，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面中的手写文字检测方法。

上述方案，获取用户的待检测图像，并获取若干标准手写文字的第一文字特征，且待检测图像包含若干待测手写文字，标准手写文字的文字属性满足预设规范条件，在此基础上，识别待检测图像，得到若干待测手写文字的第二文字特征，从而获取若干待测手写文字的第二文字特征分别与若干标准手写文字的第一文字特征之间特征相似度，进而基于特征相似度，得到待测手写文字的规范检测结果。故此，能够在用户书写完成若干待测手写文字后，基于包含若干待测手写文字的待检测图像完成对待测手写文字的检测，而无需在用户每书写完成一个文字后再进行检测，且由于待测手写文字的规范检测结果是通过识别得到待测手写文字的第二文字特征分别与若干标准手写文字的第一文字特征之间的特征相似度来得到的，故能够有利于提高手写文字检测的准确性。

附图说明

图1是本申请手写文字检测方法一实施例的流程示意图；

图2是本申请手写文字检测方法另一实施例的流程示意图；

图3是本申请手写文字检测方法又一实施例的流程示意图；

图4是本申请电子设备一实施例的框架示意图；

图5是本申请存储装置一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

请参阅图1，图1是本申请手写文字检测方法一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S11：获取用户的待检测图像，并获取若干标准手写文字的第一文字特征。

本公开实施例中，待检测图像包含若干待测手写文字，待测手写文字的具体字数可以是1个、2个、3个等等，在此不做限定。

在一个实施场景中，待检测图像的获取来源可以根据实际应用场景进行设置，在此不做限定。例如，在阅卷场景中，待检测图像可以是对考卷进行扫描(或拍摄)得到的；或者，在练字场景中，待检测图像可以是对练习字帖进行扫描(或拍摄)得到的，其他场景可以以此类推，在此不再一一举例。也就是说，本公开实施例以及下述公开实施例能够实现对包含长文本、多行文本的待检测图像的手写文字检测。

在一个实施场景中，为了提高后续识别待检测图像的准确性，在获取到待检测图像之后，还可以对待检测图像进行预处理。预处理具体可以包括但不限于：滤除噪声、图像校正、图像增强等，在此不做限定。

在一个具体的实施场景中，上述噪声可以包括但不限于：加性噪声、乘性噪声、量化噪声等，在此不做限定。此外，具体可以采用诸如均值滤波器、自适应维纳滤波器、中值滤波器、形态学噪声滤波器等滤除噪声，在此不做限定。

在另一个具体的实施场景中，图像校正指的是对失真图像进行复原性处理，具体可以包括但不限于：成像系统的象差、畸变、运动模糊等原因而引起的失真，在此不做限定。此外，具体可以采用诸如几何校正、灰度校正等方式进行图像校正，在此不做限定。

在又一个具体的实施场景中，图像增强包括但不限于：提高图像清晰度、强调图像中感兴趣区域、扩大图像中不同物体特征之间的差别、抑制不感兴趣的特征等等，在此不做限定。此外，具体可以采用诸如频率域法、空间域法等方式进行图像增强，在此不做限定。

本公开实施例中，标准手写文字的文字属性满足预设规范条件。文字属性可以包括但不限于字迹等，在此不做限定。对应地，预设规范条件可以包括但不限于字迹工整等，在此不做限定。

在一个实施场景中，标准手写文字可以是预先收集得到的，具体可以根据实际应用场景进行收集。例如，在阅卷场景中，可以预先收集考卷图像，并将考卷图像中满足预设规范条件的手写文字作为标准手写文字，此外，为了便于后续处理，考卷图像中每个手写文字均可以满足预设规范条件；或者，在练字场景中，可以预先收集练习字帖图像，并将练习字帖图像中满足预设规范条件的手写文字作为标准手写文字，此外，为了便于后续处理，练习字帖图像中每个手写文字均可以满足预设规范条件，其他场景可以以此类推，在此不再一一举例。

在另一个实施场景中，为了进一步提高手写文字检测的准确性，上述文字属性还可以进一步包括但不限于：文字字号、文字间距等等。对应地，预设规范条件可以包括但不限于：文字字号处于预设字号范围内、文字间距处于预设间距范围内等，在此不做限定。

在一个具体的实施场景中，预设字号范围可以根据实际应用场景进行设置，在此不做限定。以阅卷场景为例，阅卷场景中通常对于文字字号设有一定限制，偏大或偏小的文字字号通常均不符合阅卷期望，故此预设字号范围的上限值可以设置为阅卷场景中字号的最大期望值(如，4号)，而预设字号范围的下限值可以设置为阅卷场景中字号的最小期望值(如，5号)。其他场景可以以此类推，在此不再一一举例。

在另一个具体的实施场景中，文字间距具体可以包括但不限于相邻手写文字之间的第一文字间距、手写文字所在的第一文字行和位于第一文字行上方(或下方)的第二文字行之间的第二文字间距，对应地，在文字间距包括上述第一文字间距的情况下，预设间距范围可以包括第一预设间距范围；而在文字间距包括上述第二文字间距的情况下，预设间距范围包括第二预设间距范围，在此不做限定。此外，预设间距范围也可以根据实际应用场景进行设置，仍以阅卷场景为例，阅卷场景中通常对于文字间距设置一定限制，过大的文字间距显得文字分布稀疏，而过小的文字间距显得文字分布密集，均对可读性造成不利影响，故此预设间距范围的上限值可以设置为阅卷场景中间距的最大期望值，预设间距范围的下限值可以设置为阅卷场景中间距的最小期望值。例如，对于第一文字间距而言，其第一预设间距范围可以设置为1磅至2磅，对于第二文字间距而言，其第二预设间距范围可以设置为单倍行距至1.3倍行距，在此不做限定。其他场景可以以此类推，在此不再一一举例。

在又一个具体的实施场景中，预设规范条件还可以进一步包括：无涂改，也就说手写文字不存在涂改痕迹。

在又一个具体的实施场景中，预设规范条件还可以进一步包括：文字边界处于文字书写区域内。文字书写区域具体可以根据实际应用场景进行设置。仍以阅卷场景为例，文字书写区域可以包括但不限于：语文考卷中作文的方格区域，英语考卷中作文的横线区域。其他场景可以以此类推，在此不再一一举例。

在又一个具体的实施场景中，为了提高手写文字检测的准确性，还可以进一步约束标准手写文字所采用的字体，例如，标准手写文字可以采用诸如楷体、行楷等便于辨认的字体。

在又一个具体的实施场景中，为了适应于诸如语文作文阅卷、英语作文阅卷等现实场景，还可以进一步约束标准手写文字处于文字书写区域内。例如，对于语文作文阅卷场景，文字书写区域可以为方格，即标准手写文字处于方格内；或者，对于英语作文阅卷场景，文字书写区域可以为横线，即标准手写文字处于上下相邻的两条横线之间。

在一个实施场景中，为了提高文字识别的效率和准确性，可以预先训练一个文字识别网络，且该文字识别网络是利用满足预设规范条件的样本图像训练得到的。具体地，可以将上述预先收集到的包含标准手写文字的图像，作为样本图像，并利用上述样本图像对文字识别网络进行训练，以使得文字识别网络在训练过程中学习到标准手写文字的特征信息，特征信息具体可以包括字迹等等。在此基础上，在文字识别网络训练结束后，可以利用收敛的文字识别网络再次对上述样本图像进行识别，得到标准手写文字的第一文字特征。

在一个具体的实施场景中，文字识别网络具体可以包括但不限于：卷积神经网络(Convolutional Neural Networks，CNN)、卷积递归神经网络(Convolutional RecurrentNeural Network，CRNN)，在此不做限定。

在另一个具体的实施场景中，以英文手写文字检测为例，通过上述过程可以获取包含A、B、C、D等26个字母的标准手写文字的第一特征表示。中文手写文字检测场景可以以此类推，在此不再一一举例。

此外，需要说明的是，本公开实施例中，待测手写文字、标准手写文字可以包括但不限于：中文、英文等，具体可以根据实际应用场景进行设置，在此不做限定。例如，在语文考卷阅卷场景中，待测手写文字和标准手写文字可以包括中文；或者，在英文考卷阅卷场景中，待测手写文字和标准手写文字可以包括英文。其他场景可以以此类推，在此不再一一举例。

步骤S12：识别待检测图像，得到若干待测手写文字的第二文字特征。

在一个实施场景中，如前所述，为了提高文字识别的效率和准确性，可以预先训练一个文字识别网络，从而可以将待检测图像输入文字识别网络，得到若干待测手写文字的第二文字特征。第二文字特征具体可以包括但不限于待测手写文字的字迹特征信息等，在此不做限定。

在另一个实施场景中，请结合参阅图2，图2是本申请手写文字检测方法另一实施例的流程示意图。如图2所示，为了进一步提高文字检测的准确性，还可以先对待检测图像进行文本行识别，得到待检测图像中若干个文本行，再分别对各个文本行中的待测手写文字进行字符分割，得到每个待测手写文字的文字区域。具体地，该文字区域可以包含待测手写文字，例如，可以是包围待测手写文字的矩形框，在此不做限定。在此基础上，可以对分割得到的待测手写文字进行特征提取，得到待测手写文字的第二文字特征。

在一个具体的实施场景中，可以采用canny、roberts等边缘检测算子提取文本行的边缘线，进而可以基于边缘线，检测得到各个文本行；或者，也可以采用诸如PixelLink等神经网络检测得到各个文本行，在此不做限定。

在另一个具体的实施场景中，可以对各个文本行的图像区域进行二值化处理，并基于二值化之后的图像区域，进行连通域分析，得到各个待测手写文字，并将包含待测手写文字的矩形框，作为该待测手写文字的文字区域。此外，为了便于表示文字区域，在文字区域为包含待测手写文字的矩形框的情况下，可以以矩形框左上顶点的坐标点和矩形框右下顶点的坐标点予以表示，或者，也可以以矩形框右上顶点的坐标点和左下顶点的坐标点予以表示，在此不做限定。

步骤S13：获取若干待测手写文字的第二文字特征分别与若干标准手写文字的第一文字特征之间特征相似度。

本公开实施例中，对于每一待测手写文字，可以将该待测手写文字的第二文字特征分别与若干标准手写文字的第一文字特征进行特征相似度计算。具体地，特征相似度可以包括但不限于：余弦相似度等，在此不做限定。需要说明的是，特征相似度越大，表示待测手写文字与标准手写文字之间的相似度越高，反之，特征相似度越小，表示待测手写文字与标准手写文字之间的相似度越低。

步骤S14：基于特征相似度，得到待测手写文字的规范检测结果。

在一个实施场景中，如前所述，预设规范条件具体可以包括但不限于字迹工整，在此情况下，规范检测结果可以包括但不限于：待测手写文字是否字迹工整，则对于每一待测手写文字而言，可以将该待测手写文字与若干标准手写文字之间最高特征相似度，作为参考相似度，从而可以基于参考相似度与相似度阈值之间的大小关系，得到待测手写文字的规范检测结果。上述方式，预设规范条件设置为包括字迹工整，且规范检测结果设置为包括待测手写文字是否字迹工整，并将最高特征相似度，作为参考相似度，从而基于参考相似度与相似度阈值之间的大小关系，得到待测手写文字的规范检测结果，故此能够检测待测手写文字是否字迹工整，且通过最高特征相似度与相似度阈值之间的大小关系检测字迹是否工整，能够有利于提高手写文字检测的准确性。

在一个具体的实施场景中，请继续结合参阅图2，对于每一待测手写文字而言，可以按照特征相似度由高到低的顺序，将若干标准手写文字进行排序，为了便于描述，可以将排序后的特征相似度以数组dist_list表示，其中dist_list[0]即数组中第一个特征相似度，即最高特征相似度。此外，为了便于描述，还可以将相似度阈值记为thr。

在另一个具体的实施场景中，请继续结合参阅图2，在参考相似度(即上述dist_list[0])不小于相似度阈值的情况下，可以确定规范检测结果包括待测手写文字字迹工整，在参考相似度(即上述dist_list[0])小于相似度阈值的情况下，可以确定规范检测结果包括待测手写文字字迹不工整。上述方式，在参考相似度不小于相似度阈值的情况下，确定规范检测结果包括待测手写文字字迹工整，而在参考相似度小于相似度阈值的情况下，确定规范检测结果包括待测手写文字字迹不工整，能够有利于降低检测待测手写文字字迹是否工整的复杂度。

在又一个具体的实施场景中，可以在参考相似度小于相似度阈值的情况下，按照特征相似度由高到低的顺序，将若干标准手写文字进行排序，并选取位于前预设序位的标准手写文字，作为待测手写文字的候选手写文字。具体地，预设序位可以根据实际应用需要进行设置，例如，可以设置为3、4、5等等，在此不做限定。此外，在选取得到待测手写文字的候选手写文字之后，可以输出上述候选手写文字，以供用户查阅。进一步地，还可以在待测手写文字对应的参考相似度小于相似度阈值的情况下，输出该待测手写文字在待检测图像中的位置信息，该位置信息具体可以包括该待测手写文字的文字区域，具体可以包括前述左上顶点的坐标点和右下顶点的坐标点，或者可以包括前述右上顶点的坐标点和左下顶点的坐标点，在此不做限定。在此基础上，用户可以获悉待检测图像中不符合预设规范条件的待测手写文字，以及待测手写文字对应的候选手写文字。上述方式，在参考相似度小于相似度阈值的情况下，按照特征相似度由高到低的顺序，将若干标准手写文字进行排序，并选取位于前预设序位的标准手写文字，作为待测手写文字的候选手写文字，能够有利于提高用户对不符合预设规范条件的待测手写文字的感知，从而提高用户体验。

在又一个具体的时候场景中，相似度阈值具体可以设置为高于预设标准值，预设标准值具体可以根据实际应用需要进行设置。例如，在手写文字检测格外严格的情况下，预设标准值也可以设置地较大，具体数值在此不做限定。上述方式，通过将相似度阈值设置为高于预设标准值，能够有利于提高对待测手写文字的检测标准，从而能够降低识别容错性，有利于尽可能地检测出不符合预设规范条件的待测手写文字，进而能够降低不符合预设规范条件的待测手写文字的漏检率。

在又一个具体的实施场景中，为了进一步提高手写文字的检测效率，可以利用多线程对多个待测手写文字同时进行检测。此外，在待检测图像中所有待测手写文字均符合预设规范条件的情况下，可以认为待检测图像整体符合预设规范条件。

在一个实施场景中，在得到待检测图像中各个待测手写文字的规范检测结果之后，还可以向用户输出各个待测手写文字的规范检测结果，并获取用户对规范检测结果的修正信息，从而可以基于该修正信息从新训练文字识别网络。上述方式，通过获取用户对规范检测结果的修正信息，并基于修正信息重新训练文字识别网络，通过针对用户的修正信息对文字识别网络进行重新训练，有利于使文字识别网络识别得到用户手写文字的个性化信息，从而能够有利于提高文字识别网络对该用户手写文字检测的准确性，进而有利于提高用户体验。

在一个具体的实施场景中，如前所述，在得到待检测图像中各个待测手写文字的规范检测结果之后，可以在待检测图像中标注检测为不符合预设规范条件的待测手写文字以及该待测手写文字对应的候选手写文字，用户在获取到标注有上述信息的待检测图像之后，可以检查上述标注信息，并在对上述标注信息存在异议的情况下，对上述标注信息进行修正，例如，可以将标注为“不符合预设规范条件”的待测手写文字修改为“符合预设规范条件”，并可以进一步选择与该待测手写文字对应的候选手写文字，作为该待测手写文字的实际手写文字以完成对上述标注信息的修正。

在另一个具体的实施场景中，在用户反馈的修正信息达到一定量级(如，100份、500份等)时，可以利用修正信息重新训练文字识别网络，以针对该用户，对文字识别网络进行优化。

请参阅图3，图3是本申请手写文字检测方法又一实施例的流程示意图。本公开实施例中，规范检测结果可以进一步包括以下至少一者：文字字号是否处于预设字号范围内，文字间距是否处于预设间距范围内、文字边界是否处于预设书写区域内，在此基础上，可以进一步对待测手写文字的整体布局进行检测，提高手写文字检测的全面性。具体地，本公开实施例可以包括如下步骤：

步骤S301：基于待测手写文字的文字区域，得到待测手写文字的文字字号。

在一个实施场景中，如前述公开实施例所述，可以将包含待测手写文字的矩形框，作为该待测手写文字的文字区域。在此情况下，可以基于矩形框的面积S，得到文字字号，且面积S越大，文字字号越大。具体地，可以预先对不同文字字号所占据的面积S进行统计，以获取文字字号与面积S之间的映射关系，从而可以利用上述映射关系将待测手写文字的文字区域的面积进行映射，得到该待测手写文字的文字字号。

步骤S302：判断文字字号是否处于预设字号范围内，若是，则执行步骤S303，否则执行步骤S304。

在一个实施场景中，预设字号范围的具体设置方式可以参阅前述公开实施例中的相关描述，在此不再赘述。

在另一个实施场景中，为了简化文字字号检测，可以预先设置一个文字区域面积范围，则在得到待测手写文字的文字区域的面积S之后，也可以直接判断该待测手写文字的文字区域的面积S是否处于文字区域面积范围内。

步骤S303：确定规范检测结果包括文字字号处于预设字号范围内。

在待测手写文字的文字字号处于预设字号范围内的情况下，可以确定待测手写文字的规范检测结果包括文字字号处于预设字号范围内。

步骤S304：确定规范检测结果包括文字字号不处于预设字号范围内。

在待测手写文字的文字字号不处于预设字号范围内的情况下，可以确定待测手写文字的规范检测结果包括文字字号不处于预设字号范围内。

步骤S305：基于待测手写文字的文字区域，获取待测手写文字和与待测手写文字相邻的待测手写文字之间的第一文字间距。

本公开实施例中，与待测手写文字相邻的待测手写文字可以包括以下至少一者：位于该待测手写文字左侧且相邻的待测手写文字，位于该待测手写文字右侧且相邻的待测手写文字，在此不做限定。

在一个实施场景中，如前描述，为了便于表示文字区域，在文字区域为包含待测手写文字的矩形框的情况下，可以以矩形框左上顶点的坐标点和矩形框右下顶点的坐标点予以表示，或者，也可以以矩形框右上顶点的坐标点和左下顶点的坐标点予以表示。以采用矩形框左上顶点的坐标点和矩形框右下顶点的坐标点表示文字区域为例，以即将进行第一文字间距检测的为待测手写文字A为例，则待测手写文字A与位于其左侧且相邻的待测手写文字B之间的第一文字间距可以采用待测手写文字A左上顶点在水平X轴方向的坐标点

减去待测手写文字B右下顶点在水平X轴方向的坐标点

得到；在采用矩形框右上顶点的坐标点和矩形框左下顶点的坐标点表示文字区域的情况下，可以以此类推，在此不再一一举例。

步骤S306：判断第一文字间距是否处于第一预设间距范围内，若是，则执行步骤S307，否则执行步骤S308。

在一个实施场景中，第一预设间距范围的具体设置方式可以参阅前述公开实施例中的相关描述，在此不再赘述。

步骤S307：确定规范检测结果包括第一文字间距处于第一预设间距范围内。

在待测手写文字对应的第一文字间距处于第一预设间距范围内的情况下，可以确定规范检测结果包括第一文字间距处于第一预设间距范围内。

步骤S308：确定规范检测结果包括第一文字间距不处于第一预设间距范围内。

在待测手写文字对应的第一文字间距不处于第一预设间距范围内的情况下，可以确定规范检测结果包括第一文字间距不处于第一预设间距范围内。

步骤S309：基于待测手写文字的文字区域，获取待测手写文字所在的第一文字行和位于第一文字行上方的第二文字行之间的第二文字间距。

在一个实施场景中，如前描述，为了便于表示文字区域，在文字区域为包含待测手写文字的矩形框的情况下，可以以矩形框左上顶点的坐标点和矩形框右下顶点的坐标点予以表示，或者，也可以以矩形框右上顶点的坐标点和左下顶点的坐标点予以表示。以采用矩形框左上顶点的坐标点和矩形框右下顶点的坐标点表示文字区域为例，以即将进行第一文字间距检测的为待测手写文字A为例，则待测手写文字A与位于第二文字行的待测手写文字C之间的第二文字间距可以采用待测手写文字C右下顶点在Y轴上的坐标点

减去待测手写文字A左上顶点在Y轴上的坐标点

步骤S310：判断第二文字间距是否处于第二预设间距范围内，若是，则执行步骤S311，否则执行步骤S312。

在一个实施场景中，第二预设间距范围的具体设置方式可以参阅前述公开实施例中的相关描述，在此不再赘述。

步骤S311：确定规范检测结果包括第二文字间距处于第二预设间距范围内。

在待测手写文字对应的第二文字间距处于第二预设间距范围内的情况下，可以确定该待测手写文字的规范检测结果包括第二文字间距处于第二预设间距范围内。

步骤S312：确定规范检测结果包括第二文字间距不处于第二预设间距范围内。

在待测手写文字对应的第二文字间距不处于第二预设间距范围内的情况下，可以确定该待测手写文字的规范检测结果包括第二文字间距不处于第二预设间距范围内。

步骤S313：在待检测图像中检测到文字书写区域的情况下，基于文字区域得到待测手写文字的文字边界。

在一个实施场景中，如前述公开实施例所述，文字书写区域具体可以根据实际应用场景进行设置，例如，语文考卷中作文的方格区域，英语考卷中作文的横线区域等，在此不做限定。在此情况下，可以采用诸如Hough等格线检测算法对待检测图像进行格线检测，以检测得到待检测图像中的文字书写区域。

在一个实施场景中，如前所述，在文字区域为包含待测手写文字的矩形框的情况下，可以以矩形框左上顶点的坐标点和矩形框右下顶点的坐标点予以表示，或者，也可以以矩形框右上顶点的坐标点和左下顶点的坐标点予以表示。以采用矩形框左上顶点的坐标点和矩形框右下顶点的坐标点表示文字区域为例，文字边界具体可以包括矩形框左上顶点的坐标点和矩形框右下顶点的坐标点。其他情况可以以此类推，在此不再一一举例。

步骤S314：判断文字边界是否处于文字书写区域内，若是，则执行步骤S315，否则执行步骤S316。

在一个实施场景中，在文字边界包括矩形框左上顶点的坐标点和矩形框右下顶点的坐标点的情况下，可以通过判断左上顶点的坐标点和右下顶点的坐标点是否全部处于文字书写区域内，来判断文字边界是否处于文字书写区域(如，前述方格，或两条上下相邻横线之间)内。例如，在左上顶点的坐标点和右下顶点的坐标点全部位于文字书写区域的情况下，可以认为待测手写文字的文字边界处于文字书写区域内，在左上顶点的坐标点或右下顶点的坐标点不处于文字书写区域的情况下，即可以认为待测手写文字的文字边界不处于文字书写区域内。

步骤S315：确定规范检测结果包括文字边界处于文字书写区域内。

在待测手写文字的文字边界处于文字书写区域内的情况下，可以确定规范检测结果包括文字边界处于文字书写区域内。

步骤S316：确定规范检测结果包括文字边界不处于文字书写区域内。

在待测手写文字的文字边界不处于文字书写区域内的情况下，可以确定规范检测结果包括文字边界不处于文字书写区域内。

需要说明的是，在现实场景中，上述文字字号、第一文字间距、第二文字间距、文字边界可以选择至少一者进行检测。例如，仅选择其中一个进行检测；或者，也可以选择其中多个进行检测，在此不做限定。此外，在选择其中多个进行检测的情况下，检测的先后顺序在此不做限定。例如，在选择文字字号、第一文字间距、第二文字间距三者进行检测的情况下，可以先检测文字字号，再检测第一文字间距，最后检测第二文字间距；或者，也可以先检测第一文字间距，再检测第二文字间距，最后检测文字字号，以此类推，在此不再一一举例。

在一个实施场景中，如前述公开实施例所述，为了进一步提高手写文字的检测效率，可以利用多线程对多个待测手写文字同时进行上述检测。

在另一个实施场景中，最终可以基于上述文字字号是否处于预设字号范围内的检测结果、第一文字间距是否处于第一预设间距范围内的检测结果、第二文字间距是否处于第二预设间距范围内的检测结果，以及文字边界是否处于文字书写区域内的检测结果，得到规范检测结果。

上述方式，通过获取待测手写文字的文字字号、第一文字间距、第二文字间距、文字边界等，能够从至少一个维度对待测手写文字在待检测图像中的整体布局进行检测，有利于进一步提高手写文字检测的全面性。

请参阅图4，图4是本申请电子设备40一实施例的框架示意图。电子设备40包括相互耦接的存储器41和处理器42，存储器41中存储有程序指令，处理器42用于执行程序指令以实现上述任一手写文字检测方法实施例中的步骤。具体地，电子设备40可以包括但不限于：台式计算机、笔记本电脑、服务器、手机、平板电脑等，此外电子设备40还可以包括可用于练字的设备，且该电子设备40包括屏幕以及书写笔，屏幕上可以显示文字书写区域(如，前述方格、横线等)用户可以通过书写笔在文字书写区域内持续不断地练习书写，在书写完毕后可以将书写结果保存为待检测图像并提交检测，从而可以利用前述任一手写文字检测方法实施例中的步骤对该待检测图像进行检测，具体过程可以参阅前述公开实施例，在此不再赘述。

具体而言，处理器42用于控制其自身以及存储器41以实现上述任一手写文字检测方法实施例中的步骤。处理器42还可以称为CPU(Central Processing Unit，中央处理单元)。处理器42可能是一种集成电路芯片，具有信号的处理能力。处理器42还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器42可以由集成电路芯片共同实现。

本公开实施例中，处理器42用于获取用户的待检测图像，并获取若干标准手写文字的第一文字特征；其中，待检测图像包含若干待测手写文字，标准手写文字的文字属性满足预设规范条件；处理器42用于识别待检测图像，得到若干待测手写文字的第二文字特征；处理器42用于获取若干待测手写文字的第二文字特征分别与若干标准手写文字的第一文字特征之间特征相似度；处理器42用于基于特征相似度，得到待测手写文字的规范检测结果。

在一些公开实施例中，预设规范条件包括字迹工整，规范检测结果包括：待测手写文字是否字迹工整，处理器42用于将最高特征相似度，作为参考相似度；处理器42用于基于参考相似度与相似度阈值之间的大小关系，得到待测手写文字的规范检测结果。

区别于前述实施例，预设规范条件设置为包括字迹工整，且规范检测结果设置为包括待测手写文字是否字迹工整，并将最高特征相似度，作为参考相似度，从而基于参考相似度与相似度阈值之间的大小关系，得到待测手写文字的规范检测结果，故此能够检测待测手写文字是否字迹工整，且通过最高特征相似度与相似度阈值之间的大小关系检测字迹是否工整，能够有利于提高手写文字检测的准确性。

在一些公开实施例中，处理器42用于在参考相似度不小于相似度阈值的情况下，确定规范检测结果包括待测手写文字字迹工整；和/或，处理器42用于在参考相似度小于相似度阈值的情况下，确定规范检测结果包括待测手写文字字迹不工整。

区别于前述实施例，在参考相似度不小于相似度阈值的情况下，确定规范检测结果包括待测手写文字字迹工整，而在参考相似度小于相似度阈值的情况下，确定规范检测结果包括待测手写文字字迹不工整，能够有利于降低检测待测手写文字字迹是否工整的复杂度。

在一些公开实施例中，处理器42用于在参考相似度小于相似度阈值的情况下，按照特征相似度由高到低的顺序，将若干标准手写文字进行排序；处理器42用于选取位于前预设序位的标准手写文字，作为待测手写文字的候选手写文字。

区别于前述实施例，在参考相似度小于相似度阈值的情况下，按照特征相似度由高到低的顺序，将若干标准手写文字进行排序，并选取位于前预设序位的标准手写文字，作为待测手写文字的候选手写文字，能够有利于提高用户对不符合预设规范条件的待测手写文字的感知，从而提高用户体验。

在一些公开实施例中，相似度阈值高于预设标准值。

区别于前述实施例，通过将相似度阈值设置为高于预设标准值，能够有利于提高对待测手写文字的检测标准，从而能够降低识别容错性，有利于尽可能地检测出不符合预设规范条件的待测手写文字，进而能够降低不符合预设规范条件的待测手写文字的漏检率。

在一些公开实施例中，第一文字特征和/或第二文字特征是由文字识别网络识别得到的，文字识别网络是利用满足预设规范条件的样本图像训练得到的。

区别于前述实施例，通过文字识别网络识别得到第一文字特征和/或第二文字特征，能够有利于提高特征提取效率，且由于文字识别网络是利用满足预设规范条件的样本图像训练得到的，故能够有利于提高特征提取的准确性。

在一些公开实施例中，规范检测结果还包括以下至少一者：文字字号是否处于预设字号范围内，文字间距是否处于预设间距范围内，文字边界是否处于文字书写区域内。

区别于前述实施例，通过获取待测手写文字的文字字号、第一文字间距、第二文字间距、文字边界等，能够从至少一个维度对待测手写文字在待检测图像中的整体布局进行检测，有利于进一步提高手写文字检测的全面性。

在一些公开实施例中，处理器42用于基于待测手写文字的文字区域，得到待测手写文字的文字字号；和/或，处理器42用于基于待测手写文字的文字区域，获取待测手写文字和与待测手写文字相连的待测手写文字之间的第一文字间距；和/或，处理器42用于基于待测手写文字的文字区域，获取待测手写文字所在的第一文字行和位于第一文字行上方的第二文字行之间的第二文字间距；和/或；处理器42用于在待检测图像中检测到文字书写区域的情况下，基于文字区域得到待测手写文字的文字边界。

区别于前述实施例，通过基于待测手写文字的文字区域，获取待测手写文字的文字字号、第一文字间距、第二文字间距以及文字边界中的至少一者，能够有利于降低获取上述文字字号、第一文字间距、第二文字间距以及文字边界的复杂度。

在一些公开实施例中，第二文字特征是由文字识别网络识别得到的，处理器42用于获取用户对规范检测结果的修正信息，并基于修正信息重新训练文字识别网络。

区别于前述实施例，通过获取用户对规范检测结果的修正信息，并基于修正信息重新训练文字识别网络，通过针对用户的修正信息对文字识别网络进行重新训练，有利于使文字识别网络识别得到用户手写文字的个性化信息，从而能够有利于提高文字识别网络对该用户手写文字检测的准确性，进而有利于提高用户体验。

请参阅图5，图5是本申请存储装置50一实施例的框架示意图。存储装置50存储有能够被处理器运行的程序指令51，程序指令51用于实现上述任一手写文字检测方法实施例中的步骤。

上述方案，能够提高手写文字检测的准确性。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种手写文字检测方法，其特征在于，包括：

获取用户的待检测图像，并获取若干标准手写文字的第一文字特征；其中，所述待检测图像包含若干待测手写文字，所述标准手写文字的文字属性满足预设规范条件；

识别所述待检测图像，得到所述若干待测手写文字的第二文字特征；

获取所述若干待测手写文字的第二文字特征分别与所述若干标准手写文字的第一文字特征之间特征相似度；

基于所述特征相似度，得到所述待测手写文字的规范检测结果。

2.根据权利要求1所述的方法，其特征在于，所述预设规范条件包括字迹工整，所述规范检测结果包括：所述待测手写文字是否字迹工整；所述基于所述特征相似度，得到所述待测手写文字的规范检测结果，包括：

将最高所述特征相似度，作为参考相似度；

基于所述参考相似度与相似度阈值之间的大小关系，得到所述待测手写文字的规范检测结果。

3.根据权利要求2所述的方法，其特征在于，所述基于所述参考相似度与相似度阈值之间的大小关系，得到所述待测手写文字的规范检测结果，包括：

在所述参考相似度不小于所述相似度阈值的情况下，确定所述规范检测结果包括所述待测手写文字字迹工整；

和/或，在所述参考相似度小于所述相似度阈值的情况下，确定所述规范检测结果包括所述待测手写文字字迹不工整。

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：

在所述参考相似度小于所述相似度阈值的情况下，按照所述特征相似度由高到低的顺序，将所述若干标准手写文字进行排序；

选取位于前预设序位的标准手写文字，作为所述待测手写文字的候选手写文字。

5.根据权利要求2所述的方法，其特征在于，所述相似度阈值高于预设标准值。

6.根据权利要求1所述的方法，其特征在于，所述第一文字特征和/或所述第二文字特征是由文字识别网络识别得到的，所述文字识别网络是利用满足所述预设规范条件的样本图像训练得到的。

7.根据权利要求1所述的方法，其特征在于，所述规范检测结果还包括以下至少一者：文字字号是否处于预设字号范围内，文字间距是否处于预设间距范围内，文字边界是否处于文字书写区域内。

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

基于所述待测手写文字的文字区域，得到所述待测手写文字的文字字号；

和/或，基于所述待测手写文字的文字区域，获取所述待测手写文字和与所述待测手写文字相邻的待测手写文字之间的第一文字间距；

和/或，基于所述待测手写文字的文字区域，获取所述待测手写文字所在的第一文字行和位于所述第一文字行上方的第二文字行之间的第二文字间距；

和/或；在所述待检测图像中检测到所述文字书写区域的情况下，基于所述文字区域得到所述待测手写文字的文字边界。

9.根据权利要求1所述的方法，其特征在于，所述第二文字特征是由文字识别网络识别得到的；在所述基于所述特征相似度，得到所述待测手写文字的规范检测结果之后，所述方法还包括：

获取所述用户对所述规范检测结果的修正信息，并基于所述修正信息重新训练所述文字识别网络。

10.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现权利要求1至9任一项所述的手写文字检测方法。

11.一种存储装置，其特征在于，存储有能够被处理器运行的程序指令，所述程序指令用于实现权利要求1至9任一项所述的手写文字检测方法。